品味
学东西的时候品味很重要。品味学歪了,后面就很难再弥补。这里先零星地记录一些,以后慢慢更新和补充吧。
数学
1、偏微分方程:
dhchen 说:
很多人认为偏微分方程不美,其实我想说,它有自身独特的美感。偏微分方程的美是巴洛克式的美,最重要的是自己去算。pde(偏微分方程)这个科目不去自己动手算是不能真正理解什么的。
2、数学分析和集合论:
这两门课主要是学定义。如果你有一个疑问,特别是关于无穷的疑问,首先需要想清楚了自己到底是在问什么。如果知道了自己在问什么,那么疑问也解决得差不多了(对数学分析来说是解决了一大半,对集合论来说是几乎全解决了)。
3、线性代数
这门课的核心是向量和线性空间。向量不光是欧式空间中的向量,任何满足线性空间八条公理的元素都是线性空间中的向量;有限维的线性空间可以用矩阵来刻画。不要把它学成行列式和矩阵计算。
4、概率论
分为客观概率(频率学派)和主观概率(贝叶斯学派)两个学派。需要注意别把概率论学成应用微积分或者离散数学。
客观概率认为概率是事件重复次数无限增加后频率的极限值。学习客观概率时,要学会使用概率空间中的事件来定义随机。只要描述清楚概率空间,三门问题和 Bertrand 悖论等问题的结论就是显而易见的,表面上看似复杂的概率求解也可以轻易使用随机变量的运算法则来估计。
主观概率则认为概率是人们对于不确定的事物的信念强弱。学习主观概率(尤其是它在机器学习中的应用)时,要点是深刻理解贝叶斯定理(即后验 = 似然 * 先验 / 归一化常数),以及记住你永远是在估计结果的分布而非一个具体的值。
5、统计学
在统计学里,你没有办法证明一件事,只能尽可能地排除一件事。因此,等号一定是放在原假设上的:相等是一件概率为零的事情,无法被证明。如果数据有利于原假设,你只能说“不能拒绝原假设”而不能说“接受原假设”;如果数据不利于原假设,你却可以说“拒绝原假设而接受备择假设的结论”(备择假设不含等号,可以选择接受)。
6、数值优化
优化巨擘 Yurii Nesterov 在他的 Introductory Lectures on Convex Programming 中提到:
One of the goals of this course is to show that, despite to their attraction, the proposed "solutions" of general optimization problems very often can break down the expectations of a naive user. The main fact, which should be known to any person dealing with optimization models, is that, in general, the optimization problems are unsolvable. In our opintion, this statement, which is usually missed in standard optimization courses, is very important for understanding the entire optimization theory, its past and its future.
注意这句话:"In general, the optimization problems are unsolvable." 事实上,这是诸多数学模型(尤其是机器学习模型)难解性的根源。You can not expect an optimizer to work out-of-the-box.
当模型效果不好的时候,如果没有扎实的优化功底,经常开始怀疑人生,不知道到底是模型、数据、优化算法还是代码实现有错。系统地学过优化之后,你就可以脸不红心不跳地一步一步调试,慢慢锁定问题的根源。对于大规模机器学习来说,主要是掌握随机梯度下降及其变种算法,同时及时关注关于模型训练的实验性质的文章,了解模型不收敛时的各种现象及解决方案。
7、计算理论
分为可计算性理论和计算复杂性理论。
可计算性理论主要研究不可计算的问题,不如改名叫不可计算性理论。在可计算性理论里,每种计算模型都有一个问题达到它计算能力的边界。丘奇-图灵论题(Church-Turing thesis)声称,λ可定义函数类 = 直观可计算函数类 = 图灵机可计算函数类。因此,数学上的算法就等于图灵机算法。图灵机可能是物理上能制造出的最强计算机。
计算复杂性理论主要研究每个问题需要多少计算量来完成计算。在计算复杂性理论里,每种语言都对应一个识别它的机器,不同的复杂性类里有一些关键问题互相联系。一旦这些关键问题得到解决,不同复杂性类的关系就会立刻明朗,同一复杂性类里的其他问题也可能立即通过规约找到高效算法(例如一旦一个 NPC 问题得到解决,所有 NP 问题就都有了 P 算法,于是 NP=P)。
科学
1、杨振宁 2005 年有过一次演讲,题为《爱因斯坦:机遇和眼光》。不得不说诺奖得主的水平也是有高下之分的,杨老毫无疑问是当世前三的理论物理学家,眼光毒辣而犀利。他说:
哲学家 Whitehead 曾说,“科学的历史告诉我们,非常接近真理和懂得它的意义是两回事。每一个重要的发现都被他的发现者之前的人说过。”
对于物理学来说,发现者应该是“赋予相应公式正确的物理意义”的人,因为真正重要的是物理图像,而不是数学公式。以狭义相对论为例,庞加莱懂得了相对论的哲学,没有懂得它的物理;洛伦兹懂得了它的数学,也没有懂得它的物理。只有年轻的爱因斯坦能创建出此革命。
爱因斯坦没有错失重点是因为他对于时空有更自由的眼光。要有自由的眼光(free perception),必须能够同时近看和远看课题。
庞加莱在思考高速移动的钟如何同步时,阐述了相对论基本原理,展示了异常的哲学洞察力,然而却始终没能抓住“同时性的相对性 relativity of simultaneity”这一关键性的思想。洛伦兹推出了现今以他的名字命名的洛伦兹变换,但是他以为公式里的一些中间量只是数学推导里的辅助变量。只有爱因斯坦最终赋予了公式里每个符号的物理意义,阐述了新的时空观。其实把庞加莱和洛伦兹两个人加在一起,他们很快就能发现狭义相对论了。这也是爱因斯坦所说“如果没有我,五年内就会有人搞出狭义相对论;但是如果没有我,五十年内也不会有人搞出广义相对论”的来源。
至于广义相对论,爱因斯坦数学不好搞了很久没搞出来,他去找希尔伯特学黎曼几何和微分方程,并把自己的物理思想毫无保留地讲给希尔伯特。希尔伯特最终在爱因斯坦之前推出了场方程(此处存疑?),但是他没有抢着发表,而是等着爱因斯坦自己做出来,并说“哥廷根马路上随便找一个孩子都要比爱因斯坦更懂得四维几何。但是发明相对论的的确是爱因斯坦,而不是某个数学家。只有爱因斯坦能给那个方程赋予意义。”希尔伯特的气度也很让人敬佩啊。
突然又想起我小时候也有过“物体具有惯性,所以停止受力后也会接着运动”的想法,但是我没有像伽利略那样想“假如地板光滑无摩擦,物体可以一直运动到无限远”,也不会像牛顿那样想“摩擦力是物体运动一段时间以后停下来的原因”。这种朴素的哲学思想可以说有一些物理研究的雏形了,不过没有坚实的物理图像作支撑,这种思考便没有意义。
2、P. W. Anderson 写过一篇 More is Different,论述凝聚态物理这门学科的存在意义。他说,
还原论假设绝没有蕴含“建构论”假设,将万物还原为简单基本定律的能力,并不蕴含从这些定律出发重建整个宇宙的能力。大型和复杂粒子集合体的行为,并不能按照少数基本粒子性质的简单外推来理解。事实上,在复杂性的每一个层次,都会有崭新的性质出现。
其实,More is Different 可以应用到很多领域,绝不仅限于凝聚态物理。
3、自爱因斯坦以降,理论物理的研究范式从 实验-理论-对称性 进入了 对称性-理论-实验 的阶段。杨-米尔斯理论也是对这一范式的发扬光大,长尾科技的写的很清楚,并且通俗易通:
深度:杨-米尔斯理论说了啥?为什么说这是杨振宁超越他诺奖的贡献?
4、AlphaGo 系列的第一篇论文 Mastering the game of Go with deep neural networks and tree search 的正文第一段就讲清楚了围棋 AI 的本质:
All games of perfect information have an optimal value function, v* (s), which determines the outcome of the game, from every board position or state s, under perfect play by all players. These games may be solved by recursively computing the optimal value function in a search tree containing approximately b^d possible sequences of moves, where b is the game’s breadth (number of legal moves per position) and d is its depth (game length). In large games, such as chess (b≈35, d≈80) and especially Go (b≈250, d≈150), exhaustive search is infeasible, but the effective search space can be reduced by two general principles. First, the depth of the search may be reduced by position evaluation: truncating the search tree at state s and replacing the subtree below s by an approximate value function v(s)≈v* (s) that predicts the outcome from state s. This approach has led to superhuman performance in chess, checkers and othello, but it was believed to be intractable in Go due to the complexity of the game. Second, the breadth of the search may be reduced by sampling actions from a policy p(a|s) that is a probability distribution over possible moves a in position s. For example, Monte Carlo rollouts search to maximum depth without branching at all, by sampling long sequences of actions for both players from a policy p. Averaging over such rollouts can provide an effective position evaluation, achieving superhuman performance in backgammon and Scrabble, and weak amateur level play in Go.
棋类从数学上讲就是完全信息博弈,都存在最优价值函数来完美解决。假如不考虑计算量,也可以用递归算法遍历博弈树求解。但是实际上,围棋的博弈树太大无法穷尽,因此可以从改善搜索深度(搜索到一定深度后用近似价值函数截断)和宽度(从策略分布中采样部分子树而非穷尽全部子树)两方面来近似。
短短一段话就道出了棋类 AI 的优化方案,“只有人类有棋感,计算机只能计算”之类的言论不攻自破。
金融
1、会计三张表
资产负债表、现金流量表、利润表。资产负债表是时点数据(历史累计到当前时刻的所有情况),后两者是时段数据(一个经营周期内的数据,一般为一年)。有了资产负债表以后,后两张表可以互相导出。
2、资产负债表
资产 Asset = 负债 Liability + 所有者权益 Owner's Equity
资产:benefit inflow in the future
负债:benefit outflow in the future
例如首付 400 万,贷款 600 万,买了一套 1000 万的房,那么记 1000 万的固定资产(房子),600 万的长期贷款(负债),剩下 400 万是所有者权益。
资产证券化:将资产未来的收益打包出售
表外融资:不体现在资产负债表中的融资。企业找钱一般有两种方式,债权融资和股权融资,但这两种方式会影响企业的资产负债表。有时可以通过一些骚操作避免财务报表恶化,例如经营性租赁。
商誉 Goodwill:企业在被收购时,收购价和公允价值的差异。无收购,不商誉。
3、利润表
毛利 Gross Profit = 收入 Revenue - 销售商品成本 COGS (Cost of Goods Sold)
经营利润 Operating Income = 毛利 GP - 人员费用 SG&A
税前利润 Earnings Before Taxes = 经营利润 Operating Income - 利息费用 Interest
净利润 Net Income = 税前利润 EBT - 税 Tax
净利润一部分会拿来给股东分红,另一部分留在账上给下一年用,即净利润 NI = 分红 Dividend + 留存收益 Retained Earnings
息税前利润 EBIT = 净利润 NI + 所得税 Tax +利息 Interest = 经营利润 Operating Income + 投资收益 + 营业外收入 - 营业外支出 + 以前年度损益调整
EBITDA = 息税前利润 EBIT + 折旧 Depreciation + 摊销 Amortization(固定资产讲折旧,有年限的无形资产讲摊销)
4、现金流量表
现金流量直接和银行流水挂钩,最难作假。
现金流量表的编制有两种方法:直接法和间接法。直接法就是直接记录每一笔现金流的情况,间接法是是在净利润的基础上加减调整一些科目得到(净利润是以权责发生制为基础,现金流是以收付实现制为基础,所以两者不是直接等同的)。
现金流分为经营性现金流、投资性现金流、融资性现金流。
5、投资组合管理:
风险指的是投资组合的方差。
多个相同预期收益率的产品进行组合,可以在收益不变的情况下减少风险。
6、公司理财:
融资成本:指借钱的利率
资本结构:指企业资产里负债的比例
股价是未来现金流的折现
7、经济学:
微观经济学研究单个经济单位的经济行为,核心是价格理论。有些行业适合自然垄断,还是交给国家的好。
宏观经济学研究经济波动和经济增长。政府可以根据一些指标进行宏观调控,和通胀、通缩相比,最难处理的是滞涨。所有调控措施都有后遗症,需要靠经济体自身的增长慢慢修复。
法律
1、刑法:
法益作为入罪的基础,伦理作为出罪的依据。
谦抑性原则,又称必要性原则,指立法机关只有在该规范确属必不可少没有可以代替刑罚的其他适当方法存在的条件下,才能将某种违反法律秩序的行为设定成犯罪行为。
2、法治原则:
(公权力)法无授权不可为,(私权利)法不禁止即自由。
3、罪刑法定原则:
法无明文规定不为罪,法无明文规定不处罚。
4、罪责刑相适应原则:
重罪重判,轻罪轻判,罚当其罪,罪刑相称。