超能豬兜
2016年11月3日 星期四
关于概率论主干课程的训练
http://cos.name/2012/04/the-training-of-the-main-courses-about-probability-theory/
关于概率论主干课程的训练
1. 引言
虽然外界不大能区分“概率论”和“统计学”的差别,但是在概率统计专业内的人士们看来,这两者无论从思维方式、课程学习还是学术训练角度来看,区别还是相当明显的。比如我了解的北大概率统计系的情况,概率论和数理统计分属不同的教研室,日常的学术活动也大相径庭。研究生除了第一年会一起上专业基础课之外,之后就少有交集。我当年的体会是,在统计专业同学们的眼中,“概率论跟基础数学没有什么区别”;而在概率专业的同学看来,“统计学不像是数学”。这些对彼此颇为玩味的看法至少表现出二者之间不小的差别,即便同在“概率统计专业”的屋檐下。当然,随着统计学在我国逐步确立为一级学科,概率和统计的这种“隔阂”也许会更加明朗化。
但不可否认的是,无论统计学的未来如何发展,其主干课程中必然少不了像概率论、随机过程这样的概率基础课程。以前我在科学网上针对概率论专业的同学如何选择和学习课程发表过一些建议,因此针对咱们COS读者的背景,我重新整理了一份关于概率课程学习的若干想法,希望能对大家有所帮助。
2. 概率论要怎么学?
都说概率论是研究“随机现象”的数学,那么相对于研究“非随机现象”的数学,概率论的学习有哪些特别之处呢?
小时候咱们学数学都是从数数开始。比如学习1+1的时候,老师们会拿出两个苹果,用实物演示“一个苹果加一个苹果等于两个苹果”。正是这种基于直截了当的“观测”,我们接受起“1+1=2”这件事来就略显自然。然而,如果要理解“质地均匀的硬币出现正反面的可能性都等于二分之一”这件事,就并非那么顺利了。即便主观上我们会认同这个结果,但从观测的角度却是一个永远无法回答的问题。我们能观测的只能是有限的样本以及永远都在变化着的频率,而这个“真实的可能性”,也即“概率”的确切值,却是无法观测的。因此,概率的定义本身就曾经是一个大难题。即便在早年研究赌博问题的时候,一些数学家即能根据排列组合的方法计算一些简单的离散概率(即大家熟知的古典概型),但那主要是基于人们对概率的一些朴素认识,离构建一套完整的数学理论还差得很远。
因此,大家在学习概率论的时候,最先遇到、也是最重要的一个问题就是“如何定量描述随机现象”,即如何给出概率的定义。随着二十世纪30年代苏联数学家柯尔莫哥洛夫(1903-1987) 运用分析学中的测度理论(measure theory)完成了概率论的公理化体系,概率论才算正式登上了现代数学的殿堂。事实上,柯尔莫哥洛夫的公理化体系并未直面“概率是什么”的问题,到现在人们对于概率在哲学层面的思辨仍然在进行,但是公理化的作用是将人们对于概率的一些朴素共识或者基本性质抽象出来,形成一套公理体系,然后依据这套体系逐步发展出一套概率理论。这种思维跟当年德国数学家希尔伯特(1862-1943)所倡导的公理化思想是相一致的。值得一提的是,自打柯尔莫哥洛夫的概率公理化提出以来,对其的质疑从来就没有停止过,也不断有新的概率理论被提出,但这套理论依旧成为了概率研究的绝对主流,我们这里所谈到的概率论的学习也是指以柯尔莫哥洛夫公理化体系为基础的概率理论。
然而,在本科阶段我们学习概率论课程的时候,却往往不是从介绍柯尔莫哥洛夫的公理化体系开始。这主要是因为,要用严格的数学充分阐释概率论的公理化体系,必须要有测度论的数学基础。而测度论的课程难度很大,基本要在研究生阶段或者本科的高年级阶段才能开设。那是否要等大家学完了测度论之后再学概率论的课程呢?当然不是,就我了解全世界没有哪个国家和地区的学校会这么做。普遍的做法是在大学二年级就会开设初等概率论的课程,所适用的教材也大多基于微积分和线性代数的先修知识。这又是为什么呢?在由美国概率学家Rick Durrett教授所著的研究生教材Probability: Theory and Examples的前言部分,他提到概率论有两只手,左手是基于测度论的严格数学,右手则是概率的思考方法,也可以理解成概率的物理直观。
虽然测度论是概率论的基本数学语言,但如果真把概率论就当做测度论的一部分去学习,就只抓住了概率论两只手中的一只,而忽略了另一只联系物理直观的右手。而这只右手恰恰是概率论在现代数学之林中最难能可贵的地方。一直以来,概率论都保持了与包括物理学在内的科学领域的亲近,几乎所有的概率研究课题背后都有实际背景问题的支撑:例如离散空间随机游动问题与理论计算机、化学高分子聚合物理论;大偏差理论、粒子系统与统计物理、复杂性科学等等之间的密切联系,都极大推动了概率论这门科学的不断发展。同时,概率论的发展也得到了来自社会科学领域的刺激,特别是以随机微分方程为代表的随机分析学已经成为了数理金融领域中的基本理论和工具之一。更有趣的是,借助概率论广泛联系物理直观的特点,很多数学家纷纷借助概率论的思想帮助解决了一系列传统数学中的很多重大问题,例如当年佩雷尔曼在解决庞加莱猜想的论证过程中即用到了概率论中条件期望的想法。
因此,为了尽早让大家了解概率论所联系的物理直观以及巨大的应用价值,学校会提早开设本科概率论的课程。本科课程会尽量回避测度论,用一些仅需用微积分和线性代数就讲明白的模型,引入概率论的基本概念,培养大家的概率直观,并熟悉一些基本运算。经过了这一阶段的训练,待到本科高年级或者研究生阶段,再借助测度论的基础,进一步明确概率论的数学理论,从而迈入现代概率论的门槛。
下面我们就来具体聊聊本科和研究生的课程学习:
2.1 本科阶段准备
正如刚才所言,本科概率论的重点在于培养概率直观,理解概率基本概念的实际意义,同时通过一些具体模型的学习,熟悉一些基本的概率运算。
从课程设置来看,以往对于本科概率论的要求只是学好《初等概率论》这门课,一般也简称《概率论》。但是随着随机过程这门课越来越受重视,各大高校也纷纷在本科高年级阶段开设《应用随机过程》这门课。被冠以“应用”二字,主要是考虑到本科阶段学习的特点,了解随机过程的应用背景对初始学习这门课程是很有帮助的,很多本科阶段的随机过程教材都注意到了这一点。
关于初等概率论。一般来说,初等概率论会涉及如下主要内容:
- 概率定义的引入。首先通过如“古典概型”、“几何概型”等具体模型,了解一些朴素的概率思想。接着就会逐步引入概率的公理化定义。由于这个阶段没有测度论的数学基础,只能比较粗浅的讲一点“概率空间”的内容,并不涉及精细的可测空间的内容。在这一部分,还会介绍条件概率,独立性,全概率公式以及贝叶斯公式的基本内容。
- 随机变量及其概率分布。由于“可测性”等基本概念的缺乏,虽然会给出随机变量的一般定义,但通常并不是特别强调这一点,重点会放在介绍离散型和连续性随机变量的分布上,例如两点分布(也叫贝努利分布),二项分布,泊松分布,几何分布,均匀分布,指数分布以及正态分布等等。类似单变量微积分和多变量微积分,这部分除了涉及一维随机变量,也会有高维随机变量,也称作随机向量。随之会衍生出联合分布、边缘分布以及条件分布的概念。这一部分还有一块重要内容叫做“随机变量函数的概率分布”,即对于随机变量
X ,考虑f(X) 分布的求解方法,其中f 是一个函数。 - 数字特征。一般来说,随机变量的数字特征包括数学期望,方差,协方差,相关系数,条件期望以及母函数和特征函数等。要掌握并会求解一些重要概率分布的数字特征。
- 极限定理。包括大数定律和中心极限定理。这部分内容是概率论中最具有“统计”思想的部分,并且它们也确实对后来的数理统计学的学习具有很重要的意义。
关于本科概率论的国内外教材非常多,个人推荐几本教材,供大家参考:
- 李贤平, 概率论基础, 高等教育出版社。
- 汪仁官, 概率论引论, 北京大学出版社。
- 杨振明, 概率论, 科学出版社。
必须指出的是,因为本科概率论的课程内容已经非常成熟,刚才列举的教材都是非常优秀的国内教材,大家不必迷信国外教材。如果想读一点国外学者的著作,除了钟开莱(Chung Kai-lai)先生的《初等概率论》(Elementary Probability Theory),个人也很推崇W. Feller的经典著作《概率论及其应用》(An Introduction to Probability Theory and Its Applications)。这本书分上下册,涵盖的内容非常之多,并不适合作为教材使用,但作为参考书作为课下阅读甚好,是培养概率直观的绝佳读物。
关于应用随机过程,这门课的内容比较多元化,各大高校纷纷根据自己的实际需求开设这门课。例如一些偏重工科背景的高校,在这门课中会加入平稳过程谱分析方面的内容。还有像时间序列的部分内容也会加入其中,而在很多综合性高校的概率统计系,时间序列分析则是单独的一门课。因此,个人觉得这门课最基本也最重要的部分是马氏链(Markov Chain),如果想更多了解具有数理金融背景的内容,建议可以再重点学一下鞅论和布朗运动(Brownian motion)。
- 马氏链。马氏链实际包括离散时间马氏链和连续时间马氏链。由于测度论还没有学,一些定理结论无法给出严格证明,但这并不妨碍大家理解马氏链的物理直观。其中关于常返性以及不变分布等问题是本课程最核心的议题。作为马氏链最重要的一些模型,大家注意学习简单随机游动(simple random walk),分枝过程(branching process),泊松过程(poisson process)以及生灭过程(birth-death process)。作为实际应用还可以了解一点排队过程。
- 鞅论以及布朗运动。鞅论是随机过程理论中非常重要的部分,现代对它的兴趣很多是出于它在数理金融研究中的基础地位。布朗运动是一种具有非常好的性质的过程,也是学习随机分析学的入门基础。它的重要性是被广泛认可的,关于布朗运动的内容也是随机过程中最为丰富的部分之一。
关于应用随机过程的教材也越来越多,个人推荐的如下教材主要偏重概率统计专业的需求,侧重于工程应用的随机过程教材不在此列:
- 钱敏平,龚光鲁,应用随机过程,北京大学出版社。
- 张波, 张景肖,应用随机过程,清华大学出版社。
- 林元烈,应用随机过程,清华大学出版社。
- 钱敏平,龚光鲁,陈大岳,章复熹,应用随机过程,高等教育出版社。
- S. M. Ross, Stochastic Processes. Wiley.
- S. Karlin and H. M. A. Taylor, A First Course in Stochastic Processes. Academic press.
- P. Bremaud, Markov Chains, Gibbs Fields Monte Carlo Simulation, and Queues. Springer-Verlag.
另外,随着随机微分方程理论在金融业的大量应用,在本科阶段开设随机分析学的需求比过去强烈很多。但是要想在回避测度论的前提下把随机微分方程的内容讲明白是一件特别困难的事情。可喜的是,我们发现龚光鲁教授已经在这方面做出了大胆尝试,详见其著作《随机微分方程及其应用概要》。国外方面,T. Mikosch编写的Elementary Stochastic Calculus也可以参考。
至于说本科阶段是否需要学习测度论?国内在本科阶段单独开设测度论的学校非常少,据我所知只有北大数学学院是这样做,大多数高校是将测度论与高等概率论合成一门研究生概率论课程。当然,有了实变函数课程的训练,测度论的相当一部分内容其实是能够理解的。但这里我们仍然倾向把测度论看成研究生概率论课程的一部分来讲。
2.2 研究生阶段学习
关于研究生阶段的概率论主干课程,说得简单一些,就是在测度论的基础之上,将本科学过的内容重新梳理,逐步加深。先前也提到过,在没学测度论的时候,很多基本的概率概念和定理的数学论证是没有办法严格给出的,相应地很多内容没有办法讲透。因此,大致上研究生阶段的概率课程应包括《高等概率论》(测度论穿插其中学习),《随机过程论》以及《随机分析》这三门课。
关于高等概率论:
- 测度论。首先,我想尝试从概率论的需求角度,谈谈测度论大致要学些什么?大家知道,概率论本质上是对随机事件的发生可能性赋以一种合理的度量。那么,在数学上我们要将“事件”这个概念抽象化,这就是为什么我们要从“集合论”讲起,利用集合论的语言,我们把事件表示成某个集合中的子集而已。进一步,对于事件我们总免不了要进行一些运算,这时就有必要考虑由这些事件组成的集合,即集合的集合,在测度论中叫做集合类。随后,就是要对事件进行度量,也就是赋以相应的概率测度。这当中有很多技术细节,主要是围绕如何在一个空间中构造测度来进行的。总之,测度论的第一步就是要把测度空间建立起来,从而定义概率空间。测度论后面的内容,我们大致可以这样理解:由于概率论要考虑随机变量,所以引入可测函数的概念;由于要考虑期望等数字特征,所以引入测度积分的概念;由于要考虑条件期望,所以要学符号测度和R-N导数的概念;由于要考虑多维随机变量、联合分布以及独立性等问题,所以要引入乘积空间的概念。所以,测度论的概念在概率论中都有相应的内容。因此,一方面,我们说测度论为概率论提供了严格的数学语言,另一方面,概率论也让测度论变得越发生动。
- 极限理论。概率论中的极限理论内容很多,其中很多部分也是现代测度论的核心内容。从概率的角度来看,概率的极限理论大致分为以中心极限定理为代表的“弱收敛”理论和以大数定律为代表的“强收敛”理论。不同的教材在这部分的处理上各有侧重。个人的建议对于大多数COS的读者,还是应该侧重有概率背景的相关内容。
具体到教材部分:
偏重介绍测度论知识的教材有
偏重介绍测度论知识的教材有
- P. R. Halmos, Measure Theory(影印版), 世界图书出版社. (测度论经典教材)
- 严加安,测度论讲义,科学出版社。
将测度论与概率论结合起来的教材有
- 钟开莱,概率论教程(影印版),机械工业出版社。(经典的研究生概率论教材)
- P. Billingsley, Probability and Measure(影印版), 世界图书出版社.
- A. N. Shiryaev. Probability(影印版), 世界图书出版社.
- 汪嘉冈,现代概率论基础,复旦大学出版社。
- 严士健,刘秀芳,测度与概率,北京师范大学出版社。
- 程士宏,测度论与概率论基础,北京大学出版社。
关于随机过程论:如果说本科应用随机过程是以学习马氏链和布朗运动这样的具体模型为主,那么在有了测度论的基础之后,在随机过程论的学习过程中,一方面我们要更加深入地学习像马氏链、跳过程和布朗运动这样的模型;另一方面也会接触到随机过程的一些一般性理论,例如以马氏半群理论为代表的马氏过程构造性理论,鞅论(martingale),平稳过程以及遍历论(ergodic theory)等内容。有些教材也会把随机分析的若干内容放到随机过程论的课程当中。
国内编写的随机过程论方面的教材比较少,用得比较多的有钱敏平和龚光鲁合著的《随机过程论》。国外方面,这部分教材大致分为前苏联和美国两派。前苏联的教材体系完备,论证缜密;美国的教材一般会更活泼生动一些。
- R. Durrett, Probability: Theory and Examples(影印版), 世界图书出版社. (在美广泛流行的教材,前半部分是概率论,后半部分是随机过程论)
- 布林斯基, 施利亚耶夫, 随机过程论(中译本), 高等教育出版社. (前苏联经典教材)
关于随机分析学:随着它在金融学当中日益广泛的应用,开设这门课的高校越来越多,所以选修这门课的同学当中,一般以上可能是金融数学专业的研究生。随机分析这门课,主要是学习随机积分(特别是Ito积分),进而学习随机微分方程。这部分应该是概率论所有领域当中理论发展最为完备的分支,非常偏重分析学的风格。学习过程中,在大家正式接触其核心内容(Ito积分和随机微分方程)之前,教材一般要做很多理论上的铺垫。这个过程有点类似于咱们学定积分,在利用牛顿莱布尼茨公式计算定积分之前,要花很多功夫在引入黎曼积分的定义上。所以一开始学的时候会略显枯燥,慢慢地接触到其核心部分之时,会领略这套理论的美妙。
教材方面,最流行的当属
- B. φKsendal, Stochastic Differential Equations(影印版), 世界图书出版社.
另外,一些金融数学家编写的教材也很优秀,包括
- I. Karatzas and S. E. Shreve, Brownian Motion and Stochastic Calculus(影印版), 世界图书出版社.
国内方面的教材很少,比较常用地有龚光鲁编写的《随机微分方程引论》。
3. 结语
总而言之,关于概率论课程的训练,一方面是基于概率论公理化方面的数学训练,另一方面通过对具体概率模型的演算和掌握,加深对概率论物理直观的理解。当然,即便是同为统计学专业的同学,不同的发展需求决定了学习的目的和内容,立志要在Annals of Statistics上发表好文章和希望进入统计局工作的同学,自然会在概率课程的学习中各有侧重。更重要的是,现在谁都很难估计统计学会以什么样的路径发展。时光倒流30年,概率课程毫无疑问是统计学最核心的基础课程。现在,随着人们对数据的需求和认识逐渐发生根本性的转变,高通量高维数据的不断产生对传统统计思维和方法提出严峻挑战,我们已经看到有大量其它数学分支的研究成果被用于高维数据的处理和分析问题当中。但我相信,既然本质上概率论和统计学都在共同关注随机现象,共同面对“观测”所带来的困境,二者唇齿相依的关系就不会动摇。
计算机科学反思录
(轉自網上)
计算机科学反思录
(ZT)
计算机科学这一门科学深深的吸引着我们这些同学们,上计算机系已经有近三年了,自己
也做了一些思考,我一直认为计算机科学这门专业,在本科阶段是不可能切分成计算机科学
和计算机技术的,因为计算机科学需要相当多的实践,而实践需要技术;每一个人(包括非
计算机专业),掌握简单的计算机技术都很容易(包括程序设计),但计算机专业的优势就
在于,我们掌握许多其他专业并不“深究”的东西,例如,算法,体系结构,等等。非计算
机专业的人可以很容易地做一个芯片,写一段程序,但他们做不出计算机专业能够做出来的
大型系统。今天我想专门谈一谈计算机科学,并将重点放在计算理论上。
计算机理论的一个核心问题——从数学谈起:
记得当年大一入学,每周六课时高等数学,天天作业不断(那时是六日工作制)。颇有些同
学惊呼走错了门:咱们这到底念的是什么系?不错,你没走错门,这就是计算机科学与技
术系。我国计算机科学系里的传统是培养做学术研究,尤其是理论研究的人(方向不见得
有问题,但是做得不是那么尽如人意)。而计算机的理论研究,说到底了,如网络安全,
图形图像学,视频音频处理,哪个方向都与数学有着很大的关系,虽然也许是正统数学家
眼里非主流的数学。这里我还想阐明我的一个观点:我们都知道,数学是从实际生活当中
抽象出来的理论,人们之所以要将实际抽象成理论,目的就在于想用抽象出来的理论去更
好的指导实践,有些数学研究工作者喜欢用一些现存的理论知识去推导若干条推论,殊不
知其一:问题考虑不全很可能是个错误的推论,其二:他的推论在现实生活中找不到原型,
不能指导实践。严格的说,我并不是一个理想主义者,政治课上学的理论联系实际一直是
指导我学习科学文化知识的航标(至少我认为搞计算机科学与技术的应当本着这个方向)。
其实我们计算机系学数学光学高等数学是不够的(典型的工科院校一般都开的是高等数学,
我们应该像数学系一样学一下数学分析(清华计算机系开的就是数学分析),数学分析这
门科学,咱们学计算机的人对它有很复杂的感情。在于它是偏向于证明型的数学课程,这
对我们培养良好的分析能力极有帮助。我的软件工程学导师北工大数理学院的王仪华先生
就曾经教导过我们,数学系的学生到软件企业中大多作软件设计与分析工作,而计算机系
的学生做程序员的居多,原因就在于数学系的学生分析推理能力,从所受训练的角度上要
远远在我们之上。当年出现的怪现象是:计算机系学生的高中数学基础在全校数一数二(希
望没有冒犯其它系的同学),教学课时数也仅次于数学系,但学完之后的效果却不尽如人意。
难道都是学生不努力吗,我看未见得,方向错了也说不一定,其中原因何在,发人深思。
我个人的浅见是:计算机系的学生,对数学的要求固然跟数学系不同,跟物理类差别则更
大。通常非数学专业的所谓“高等数学”,无非是把数学分析中较困难的理论部分删去,
强调套用公式计算而已。而对计算机系来说,数学分析里用处最大的恰恰是被删去的理论
部分。说得难听一点,对计算机系学生而言,追求算来算去的所谓“工程数学”已经彻底
地走进了误区。记上一堆曲面积分的公式,难道就能算懂了数学?那倒不如现用现查,何
必费事记呢?再不然直接用Mathematics或是Matalab好了。
我在系里最爱做的事情就是给学弟学妹们推荐参考书。中文的数学分析书,一般都认为以
北大张筑生老师的“数学分析新讲”为最好。万一你的数学实在太好,那就去看菲赫金哥
尔茨的“微积分学教程”好了--但我认为没什么必要,毕竟你不想转到数学系去。吉米多
维奇的“数学分析习题集”也基本上是计算型的东东。书的名气很大,倒不见得适合我们,
还是那句话,重要的是数学思想的建立,生活在信息社会里我们求的是高效,计算这玩
意还是留给计算机吧。不过现在多用的似乎是复旦大学的《数学分析》也是很好的教材。
中国的所谓高等代数,就等于线性代数加上一点多项式理论。我以为这有好的一面,因为
可以让学生较早感觉到代数是一种结构,而非一堆矩阵翻来覆去。这里不得不提南京大学
林成森,盛松柏两位老师编的“高等代数”,感觉相当舒服。此书相当全面地包含了关于
多项式和线性代数的基本初等结果,同时还提供了一些有用的又比较深刻的内容,如Sturm
序列,Shermon-Morrison公式,广义逆矩阵等等。可以说,作为本科生如能吃透此书,
就可以算高手。国内较好的高等代数教材还有清华计算机系用的那本,清华出版社出版,
书店里多多,一看就知道。从抽象代数的观点来看,高等代数里的结果不过是代数系统性
质的一些例子而已。莫宗坚先生的《代数学》里,对此进行了深刻的讨论。然而莫先生的
书实在深得很,作为本科生恐怕难以接受,不妨等到自己以后成熟了一些再读。
正如上面所论述的,计算机系的学生学习高等数学:知其然更要知其所以然。你学习的目
的应该是:将抽象的理论再应用于实践,不但要掌握题目的解题方法,更要掌握解题思想,
对于定理的学习:不是简单的应用,而是掌握证明过程即掌握定理的由来,训练自己的
推理能力。只有这样才达到了学习这门科学的目的,同时也缩小了我们与数学系的同学之
间思维上的差距。
概率论与数理统计这门课很重要,可惜大多数院校讲授这门课都会少些东西。少了的东西
现在看至少有随机过程。到毕业还没有听说过Markov过程,此乃计算机系学生的耻辱。没
有随机过程,你怎么分析网络和分布式系统?怎么设计随机化算法和协议?清华计算机系
开有“随机数学”,早就是必修课。另外,离散概率论对计算机系学生来说有特殊的重要
性。而我们国家工程数学讲的都是连续概率。现在,美国已经有些学校开设了单纯的“离
散概率论”课程,干脆把连续概率删去,把离散概率讲深些。我们不一定要这么做,但应
该更加强调离散概率是没有疑问的。这个工作我看还是尽早的做为好。
计算方法学(有些学校也称为数学分析学)是最后一门由数理学院给我们开的课。一般学
生对这门课的重视程度有限,以为没什么用。不就是照套公式嘛!其实,做图形图像可离
不开它,密码学搞深了也离不开它。而且,在很多科学工程中的应用计算,都以数值的为
主。这门课有两个极端的讲法:一个是古典的“数值分析”,完全讲数学原理和算法;另
一个是现在日趋流行的“科学与工程计算”,干脆教学生用软件包编程。我个人认为,计
算机系的学生一定要认识清楚我们计算机系的学生为什么要学这门课,我是很偏向于学好
理论后用计算机实现的,最好使用C语言或C++编程实现。向这个方向努力的书籍还是挺多
的,这里推荐大家高等教育出版社(CHEP)和施普林格出版社(Springer)联合出版的《计
算方法(Computational Methods)》,华中理工大学数学系写的(现华中科技大学),这
方面华科大做的工作在国内应算是比较多的,而个人认为以这本最好,至少程序设计方面
涉及了:任意数学函数的求值,方程求根,线性方程组求解,插值方法,数值积分,场微
分方程数值求解。李庆扬的那本则理论性过强,与实际应用结合得不太紧。
每个学校本系里都会开一门离散数学,涉及集合论,图论,和抽象代数,数理逻辑。不过,
这么多内容挤在离散数学一门课里,是否时间太紧了点?另外,计算机系学生不懂组合
和数论,也是巨大的缺陷。要做理论,不懂组合或者数论吃亏可就太大了。从理想的状态
来看,最好分开六门课:集合,逻辑,图论,组合,代数,数论。这个当然不现实,因为
没那么多课时。也许将来可以开三门课:集合与逻辑,图论与组合,代数与数论。(这方
面我们学校已经着手开始做了)不管课怎么开,学生总一样要学。下面分别谈谈上面的三
组内容。
古典集合论,北师大出过一本《基础集合论》不错。 数理逻辑,中科院软件所陆钟万教
授的《面向计算机科学的数理逻辑》就不错。现在可以找到陆钟万教授的讲课录像http:/
/www.cas.ac.cn/html/Dir/2001/11/06/3391.htm自己去看看吧。总的来说,学集合/
逻辑起手不难,普通高中生都能看懂。但越往后越感觉深不可测。
学完以上各书之后,如果你还有精力兴趣进一步深究,那么可以试一下GTM系列中的《Int
roduction to Axiomatic Set Theory》和《A Course of Mathematical Logic》。这
两本都有世界图书出版社的引进版。你如果能搞定这两本,可以说在逻辑方面真正入了门,
也就不用再浪费时间听我瞎侃了。
据说全中国最多只有三十个人懂图论。此言不虚。图论这东东,技巧性太强,几乎每个问
题都有一个独特的方法,让人头痛。不过这也正是它魅力所在:只要你有创造性,它就能
给你成就感。我的导师说,图论里面随便揪一块东西就可以写篇论文。大家可以体会里面
内容之深广了吧!国内的图论书中,王树禾老师的“图论及其算法”非常成功。一方面,
其内容在国内教材里算非常全面的。另一方面,其对算法的强调非常适合计算机系(本来
就是科大计算机系教材)。有了这本书为主,再参考几本翻译的,如Bondy & Murty的《图
论及其应用》,人民邮电出版社翻译的《图论和电路网络》等等,就马马虎虎,对本科生
足够了。再进一步,世界图书引进有GTM系列的"Modern Graph Theory"。此书确实经典!
国内好象还有一家出版了个翻译版。不过,学到这个层次,还是读原版好。搞定这本书,
也标志着图论入了门。
离散数学方面我们北京工业大学实验学院有个世界级的专家,叫邵学才,复旦大学概率论
毕业的,教过高等数学,线性代数,概率论,最后转向离散数学,出版著作无数,论文集
新加坡有一本,堪称经典,大家想学离散数学的真谛不妨找来看看。这老师的课我专门去
听过,极为经典。不过你要从他的不经意的话中去挖掘精髓。在同他的交谈当中我又深刻
地发现一个问题,虽说邵先生写书无数,但依他自己的说法每本都差不多,我实在觉得诧
异,他说主要是有大纲的限制,不便多写。这就难怪了,很少听说国外写书还要依据个什
么大纲(就算有,内容也宽泛的多),不敢越雷池半步,这样不是看谁的都一样了。外版
的书好就好在这里,最新的科技成果里面都有论述,别的先不说,至少是“紧跟时代的理
论知识”。
组合感觉没有太适合的国产书。还是读Graham和Knuth等人合著的经典“具体数学”吧,西
安电子科技大学出版社有翻译版。 抽象代数,国内经典为莫宗坚先生的“代数学”。此书
是北大数学系教材,深得好评。然而对本科生来说,此书未免太深。可以先学习一些其它
的教材,然后再回头来看“代数学”。国际上的经典可就多了,GTM系列里就有一大堆。推
荐一本谈不上经典,但却最简单的,最容易学的http://www.math.miami.edu/~ec/book/
这本“Introduction to Linear and Abstract Algebra"非常通俗易懂,而且把抽象代
数和线性代数结合起来,对初学者来说非常理想,我校比较牛的同学都有收藏。
数论方面,国内有经典而且以困难著称的”初等数论“(潘氏兄弟著,北大版)。再追溯一
点,还有更加经典(可以算世界级)并且更加困难的”数论导引“(华罗庚先生的名著,科
学版,九章书店重印,繁体的看起来可能比较困难)。把基础的几章搞定一个大概,对本
科生来讲足够了。但这只是初等数论。本科毕业后要学计算数论,你必须看英文的书,如
Bach的"Introduction to Algorithmic Number Theory"。
计算机科学理论的根本,在于算法。现在很多系里给本科生开设算法设计与分析,确实非
常正确。环顾西方世界,大约没有一个三流以上计算机系不把算法作为必修的。算法教材
目前公认以Corman等著的"Introduction to Algorithms"为最优。对入门而言,这一本
已经足够,不需要再参考其它书。
再说说形式语言与自动机。我看过北邮的教材,应该说写的还清楚。但是,有一点要强调:
形式语言和自动机的作用主要在作为计算模型,而不是用来做编译。事实上,编译前端已
经是死领域,没有任何open problems,北科大的班晓娟博士也曾经说过,编译的技术已
相当成熟。如果为了这个,我们完全没必要去学形式语言--用用yacc什么的就完了。北邮
的那本在国内还算比较好,但是在深度上,在跟可计算性的联系上都有较大的局限,现代
感也不足。所以建议有兴趣的同学去读英文书,不过国内似乎没引进这方面的教材。可以
去互动出版网上看一看。入门以后,把形式语言与自动机中定义的模型,和数理逻辑中用
递归函数定义的模型比较一番,可以说非常有趣。现在才知道,什么叫“宫室之美,百官
之富”!
计算机科学和数学的关系有点奇怪。二三十年以前,计算机科学基本上还是数学的一个分
支。而现在,计算机科学拥有广泛的研究领域和众多的研究人员,在很多方面反过来推动
数学发展,从某种意义上可以说是孩子长得比妈妈还高了。但不管怎么样,这个孩子身上
始终流着母亲的血液。这血液是the mathematical underpinning of computer science
(计算机科学的数学基础),也就是理论计算机科学。原来在东方大学城图书馆中曾经看过
一本七十年代的译本(书皮都没了,可我就爱关注这种书),大概就叫《计算机数学》。
那本书若是放在当时来讲决是一本好书,但现在看来,涵盖的范围还算广,深度则差了许
多,不过推荐大一的学生倒可以看一看,至少可以使你的计算数学入入门。
最常和理论计算机科学放在一起的一个词是什么?答:离散数学。这两者的关系是如此密
切,以至于它们在不少场合下成为同义词。(这一点在前面的那本书中也有体现)传统上,
数学是以分析为中心的。数学系的同学要学习三四个学期的数学分析,然后是复变函数,
实变函数,泛函数等等。实变和泛函被很多人认为是现代数学的入门。在物理,化学,工
程上应用的,也以分析为主。
随着计算机科学的出现,一些以前不太受到重视的数学分支突然重要起来。人们发现,这
些分支处理的数学对象与传统的分析有明显的区别:分析研究的问题解决方案是连续的,
因而微分,积分成为基本的运算;而这些分支研究的对象是离散的,因而很少有机会进行
此类的计算。人们从而称这些分支为“离散数学”。“离散数学”的名字越来越响亮,最
后导致以分析为中心的传统数学分支被相对称为“连续数学”。
离散数学经过几十年发展,基本上稳定下来。一般认为,离散数学包含以下学科:
1) 集合论,数理逻辑与元数学。这是整个数学的基础,也是计算机科学的基础。
2) 图论,算法图论;组合数学,组合算法。计算机科学,尤其是理论计算机科学的核心
是算法,而大量的算法建立在图和组合的基础上。
3) 抽象代数。代数是无所不在的,本来在数学中就非常重要。在计算机科学中,人们惊
讶地发现代数竟然有如此之多的应用。
但是,理论计算机科学仅仅就是在数学的上面加上“离散”的帽子这么简单吗?一直到大
约十几年前,终于有一位大师告诉我们:不是。D.E.Knuth(他有多伟大,我想不用我废话
了)在Stanford开设了一门全新的课程Concrete Mathematics。 Concrete这个词在这里有
两层含义:
首先:对abstract而言。Knuth认为,传统数学研究的对象过于抽象,导致对具体的问题
关心不够。他抱怨说,在研究中他需要的数学往往并不存在,所以他只能自己去创造一些
数学。为了直接面向应用的需要,他要提倡“具体”的数学。在这里我做一点简单的解释。
例如在集合论中,数学家关心的都是最根本的问题--公理系统的各种性质之类。而一些具
体集合的性质,各种常见集合,关系,映射都是什么样的,数学家觉得并不重要。然而,
在计算机科学中应用的,恰恰就是这些具体的东西。Knuth能够首先看到这一点,不愧为
当世计算机第一人。其次,Concrete是Continuous(连续)加上discrete(离散)。不管连续
数学还是离散数学,都是有用的数学!
理论与实际的结合——计算机科学研究的范畴
前面主要是从数学角度来看的。从计算机角度来看,理论计算机科学目前主要的研究领域
包括:可计算性理论,算法设计与复杂性分析,密码学与信息安全,分布式计算理论,并
行计算理论,网络理论,生物信息计算,计算几何学,程序语言理论等等。这些领域互相
交叉,而且新的课题在不断提出,所以很难理出一个头绪来。想搞搞这方面的工作,推荐
看中国计算机学会的一系列书籍,至少代表了我国的权威。下面随便举一些例子。
由于应用需求的推动,密码学现在成为研究的热点。密码学建立在数论(尤其是计算数论),
代数,信息论,概率论和随机过程的基础上,有时也用到图论和组合学等。很多人以为
密码学就是加密解密,而加密就是用一个函数把数据打乱。这样的理解太浅显了。
现代密码学至少包含以下层次的内容:
第一,密码学的基础。例如,分解一个大数真的很困难吗?能否有一般的工具证明协议正
确?
第二,密码学的基本课题。例如,比以前更好的单向函数,签名协议等。
第三,密码学的高级问题。例如,零知识证明的长度,秘密分享的方法。
第四,密码学的新应用。例如,数字现金,叛徒追踪等。
在分布式系统中,也有很多重要的理论问题。例如,进程之间的同步,互斥协议。一个经
典的结果是:在通信信道不可靠时,没有确定型算法能实现进程间协同。所以,改进TCP
三次握手几乎没有意义。例如时序问题。常用的一种序是因果序,但因果序直到不久前才
有一个理论上的结果....例如,死锁没有实用的方法能完美地对付。例如,......操作系
统研究过就自己去举吧!
如果计算机只有理论,那么它不过是数学的一个分支,而不成为一门独立的科学。事实上,
在理论之外,计算机科学还有更广阔的天空。
我一直认为,4年根本不够学习计算机的基础知识,因为面太宽了......
这方面我想先说说我们系在各校普遍开设的《计算机基础》。在高等学校开设《计算机基
础课程》是我国高教司明文规定的各专业必修课程要求。主要内容是使学生初步掌握计算
机的发展历史,学会简单的使用操作系统,文字处理,表格处理功能和初步的网络应用功
能。但是在计算机科学系教授此门课程的目标决不能与此一致。在计算机系课程中目标应
是:让学生较为全面的了解计算机学科的发展,清晰的把握计算机学科研究的方向,发展
的前沿即每一个课程在整个学科体系中所处的地位。搞清各学科的学习目的,学习内容,
应用领域。使学生在学科学习初期就对整个学科有一个整体的认识,以做到在今后的学习
中清楚要学什么,怎么学。计算机基本应用技能的位置应当放在第二位或更靠后,因为这
一点对于本系的学生应当有这个摸索能力。这一点很重要。推荐给大家一本书:机械工业
出版社的《计算机文化》(New Perspective of Computer Science),看了这本书我才
深刻的体会到自己还是个计算机科学初学者,才比较透彻的了解了什么是计算机科学。另
外在厦门大学赵致琢老师的著作《计算科学导论》当中的很多经典理论都是在同类书籍中
很难找到的。看看他也许你才会明白一个最基本的问题:为什么计算机科学叫计算科学更
为准确。这本书在世界上也可成为精品级的著作。
一个一流计算机系的优秀学生决不该仅仅是一个编程高手,但他一定首先是一个编程高手。
我上大学的时候,第一门专业课是C语言程序设计,念计算机的人从某种角度讲相当一部
分人是靠写程序吃饭的。在我们北京工业大学实验学院计算机系里一直有这样的争论(时
至今日CSDN上也有),关于第一程序设计语言该用哪一种。我个人认为,用哪种语言属
于末节,关键在养成良好的编程习惯。当年老师对我们说,打好基础后学一门新语言只要
一个星期。现在我觉得根本不用一个星期,前提是先把基础打好。不要再犹豫了,学了再
说,等你抉择好了,别人已经会了几门语言了。
汇编语言和微机原理是两门特烦人的课。你的数学/理论基础再好,也占不到什么便宜。
这两门课之间的次序也好比先有鸡还是先有蛋,无论你先学哪门,都会牵扯另一门课里的
东西。所以,只能静下来慢慢琢磨。这就是典型的工程课,不需要太多的聪明和顿悟,却
需要水滴石穿的渐悟。有关这两门课的书,计算机书店里不难找到。弄几本最新的,对照
着看吧。组成原理推荐《计算机组成与结构》清华大学王爱英教授写的。汇编语言大家拿
8086/8088入个门,之后一定要学80x86汇编语言。实用价值大,不落后,结构又好,写写
高效病毒,高级语言里嵌一点汇编,进行底层开发,总也离不开他,推荐清华大学沈美明
的《IBM—PC汇编语言程序设计》。有些人说不想了解计算机体系结构,也不想制造计算
机,所以诸如计算机原理,汇编语言,接口之类的课觉得没必要学,这样合理吗?显然不
合理,这些东西迟早得掌握,肯定得接触,而且,这是计算机专业与其他专业学生相比的
少有的几项优势。做项目的时候,了解这些是非常重要的,不可能说,仅仅为了技术而技
术,只懂技术的人最多做一个编码工人,而永远不可能全面地了解整个系统的设计,而编
码工人是越老越不值钱。关于组成原理还有个讲授的问题,在我学这门课程时老师讲授时
把CPU工作原理与微程序设计这一块略掉了,理由是我们国家搞CPU技术不如别的国家,搞
了这么长时间好不容易出了个龙芯比Intel的还差个十万八千里,所以建议我们不要学了。
我看这在各校也未见得不是个问题吧!若真是如他所说,那中国的计算机科学哪个方向都
可以停了,软硬件,应用,有几项搞得过美国,搞不过别人就不搞了,那我们坐在这里干
什么?教学的观念需要转变的。
模拟电路这东东,如今不仅计算机系学生搞不定,电子系学生也多半害怕。如果你真想软
硬件通吃,那么建议你先看看邱关源的“电路原理”,也许此后再看模拟电路底气会足些。
教材:康华光的“电子技术基础”(高等教育出版社)还是不错的(我校电子系在用)。
有兴趣也可以参考童诗白的书。
数字电路比模拟电路要好懂得多。推荐大家看一看我们北工大刘英娴教授写的《数字逻辑》
业绩(界)人士都说这本书很有参考价值(机械工业出版社的)。原因很明了,实用价值高,能
听听她讲授的课程更是有一种“享受科学”的感觉。清华大学阎石的书也算一本好教材,
遗憾的一点是集成电路讲少了些。真有兴趣,看一看大规模数字系统设计吧(北航那本用
的还比较多)。
计算机系统结构该怎么教,国际上还在争论。国内能找到的较好教材为Stallings的
"Computer Organization and Architectureesigning for Performance"(清华影印本)。
国际上最流行的则是“Computer architecture: a quantitative approach", by
Patterson & Hennessy。
操作系统可以随便选用《操作系统的内核设计与实现》和《现代操作系统》两书之一。这
两部都可以算经典,唯一缺点就是理论上不够严格。不过这领域属于Hardcore System,所
以在理论上马虎一点也情有可原。想看理论方面的就推荐清华大学出版社《操作系统》吧,
高教司司长张尧学写的,我们教材用的是那本。 另外推荐一本《Windows操作系统原理》
机械工业出版社的,这本书是我国操作系统专家在微软零距离考察半年,写作历时一年
多写成的,教操作系统的专家除了清华大学的张尧学(现高教司司长)几乎所有人都参加
了。Bill Gates亲自写序。里面不但结合windows2000,xp详述操作系统的内核,而且后面
讲了一些windows编程基础,有外版书的味道,而且上面一些内容可以说在国内外只有那
本书才有对windows内核细致入微的介绍。
如果先把形式语言学好了,则编译原理中的前端我看只要学四个算法:最容易实现的递归
下降;最好的自顶向下算法LL(k);最好的自底向上算法LR(k);LR(1)的简化SLR(也许还
有另一简化LALR)。后端完全属于工程性质,自然又是another story。 推荐教材:
Kenneth C.Louden写的“Compiler Construction Principles and Practice”即是
《编译原理及实践》(机械工业出版社的译本)
学数据库要提醒大家的是,会用VFP,VB, Power builder不等于懂数据库。(这世界上自
以为懂数据库的人太多了!)数据库设计既是科学又是艺术,数据库实现则是典型的工程。
所以从某种意义上讲,数据库是最典型的一门计算机课程——理工结合,互相渗透。另
外推荐大家学完软件工程学后再翻过来看看数据库技术,又会是一番新感觉。推荐教材:
Abraham Silberschatz等著的 "Database System Concepts".作为知识的完整性,还推
荐大家看一看机械工业出版社的《数据仓库》译本。
计算机网络的标准教材还是来自Tanenbaum的《Computer Networks》(清华大学有译本).
还有就是推荐谢希仁的《计算机网络教程》(人民邮电出版社)问题讲得比较清楚,参
考文献也比较权威。不过,网络也属于Hardcore System,所以光看书是不够的。建议多
读RFChttp://www.ietf.org/rfc.htm里可以按编号下载RFC文档。从IP的读起。等到能掌
握10种左右常用协议,就没有几个人敢小看你了。再做的工作我看放在网络设计上就比较
好了。
数据结构的重要性就不言而喻了,学完数据结构你会对你的编程思想进行一番革命性的洗
礼,会对如何建立一个合理高效的算法有一个清楚的认识。对于算法的建立我想大家应当
注意以下几点:
当遇到一个算法问题时,首先要知道自己以前有没有处理过这种问题.如果见过,那么你一
般会顺利地做出来;如果没见过,那么考虑以下问题:
1. 问题是否是建立在某种已知的熟悉的数据结构(例如,二叉树)上?如果不是,则要自己设
计数据结构。
2. 问题所要求编写的算法属于以下哪种类型?(建立数据结构,修改数据结构,遍历,查找,
排序...)
3. 分析问题所要求编写的算法的数学性质.是否具备递归特征?(对于递归程序设计,只要
设计出合理的参数表以及递归结束的条件,则基本上大功告成.)
4. 继续分析问题的数学本质.根据你以前的编程经验,设想一种可能是可行的解决办法,并
证明这种解决办法的正确性.如果题目对算法有时空方面的要求,证明你的设想满足其要求.
一般的,时间效率和空间效率难以兼得.有时必须通过建立辅助存储的方法来节省时间.
5. 通过一段时间的分析,你对解决这个问题已经有了自己的一些思路.或者说,你已经可以
用自然语言把你的算法简单描述出来.继续验证其正确性,努力发现其中的错误并找出解决
办法.在必要的时候(发现了无法解决的矛盾),推翻自己的思路,从头开始构思.
6. 确认你的思路可行以后,开始编写程序.在编写代码的过程中,尽可能把各种问题考虑得
详细,周密.程序应该具有良好的结构,并且在关键的地方配有注释.
7. 举一个例子,然后在纸上用笔执行你的程序,进一步验证其正确性.当遇到与你的设想不
符的情况时,分析问题产生的原因是编程方面的问题还是算法思想本身有问题.
8. 如果程序通过了上述正确性验证,那么在将其进一步优化或简化。
9. 撰写思路分析,注释.
对于具体的算法思路,只能靠你自己通过自己的知识和经验来加以获得,没有什么特定的规
律(否则程序员全部可以下岗了,用机器自动生成代码就可以了).要有丰富的想象力,就是
说当一条路走不通时,不要钻牛角尖,要敢于推翻自己的想法.我也只不过是初学者,说出上
面的一些经验,仅供大家参考和讨论。
关于人工智能,我觉得的也是非常值得大家仔细研究的,虽然不能算是刚刚兴起的学科了,
但是绝对是非常有发展前途的一门学科。我国人工智能创始人之一,北京科技大学涂序彦
教授(这老先生是我的导师李小坚博士的导师)对人工智能这样定义:人工智能是模仿、
延伸和扩展人与自然的智能的技术科学。在美国人工智能官方教育网站上对人工智能作
了如下定义:Artificial Intelligence, or AI for short, is a combination of
computer science, physiology, and philosophy. AI is a broad topic, consisting
of different fields, from machine vision to expert systems. The element that
the fields of AI have in common is the creation of machines that can "think".
这门学科研究的问题大概说有:
(1)符号主义: 符号计算与程序设计基础,知识表达方法 :知识与思维,产生式规则,
语意网络,一阶谓词逻辑问题求解方法:搜索策略,启发式搜寻,搜寻算法,问题规约
方法,谓词演算:归结原理,归结过程专家系统:建立专家系统的方法及工具
(2)联接主义(神经网络学派):1988年美国权威机构指出:数据库,网络发展呈直线
上升,神经网络可能是解决人工智能的唯一途径。
我想对于人工智能的学习,大家一定不要像学数学似的及一些现成的结论,要学会分析问
题,最好能利用程序设计实现,这里推荐给大家ACM最佳博士论文奖获得者涂晓媛博士的
著作《人工鱼—计算机动画的人工生命方法》(清华大学出版社)。搞人工生命的同学不
会不知道国际知名的涂氏父女吧。关于人工智能的书当然首选《Artificial
Intelligence A New Synthesis》Nils J.Nilsson.鼻祖嘛!
关于网络安全我也想在这里说两句,随着计算机技术的发展,整个社会的信息化水平突飞
猛进,计算机网络技术日新月异,网络成了当即社会各个工作领域不可缺少的组成部分,
只要有网络存在,网络安全问题就是一个必须解决好的问题,学习网络安全不是简简单单
的收集一些黑客工具黑一黑别人的网站,而是要学习他的数学原理,实现原理,搞清底层
工作机制,这样才能解决大部分的现有问题和新出现的安全问题。
关于计算机科学的一些边缘科学我想谈一谈软件工程技术,对于一个企业,推出软件是不
是就是几个程序员坐在一起,你写一段程序,我写一段程序呢?显然不是。软件工程是典
型的计算机科学和数学,管理科学,心理学,社会学等学科的综合。它使我们这些搞理论
和技术的人进入了一个社会。你所要考虑的不仅仅是程序的优劣,更应该考虑程序与软件
的区别,软件与软件产品的区别,软件软件产品的市场前景,如何去更好的与人交流。这
方面我还在学习阶段,以后这方面再写文章吧,先推荐给大家几本书:畅销20年不衰的《
人月神话》(清华大学中文版,中国电力出版社影印版),《软件工程-实践者研究的方
法》(机械工业出版社译本),《人件》(据说每一位微软公司的部门经理都读过这本书,
推荐老总们和想当老总的同学都看看,了解一下什么是软件企业中的人)以及微软公司的
《软件开发的科学与艺术》和《软件企业的管理与文化》(研究软件企业的制胜之道当然
要研究微软的成功经验了!)
关于计算机技术的学习我想是这样的:学校开设的任何一门科学都有其滞后性,不要总认
为自己掌握的某门技术就已经是天下无敌手了,虽然现在Java,VB,C,C++用的都很多,怎
能保证没有被淘汰的一天,我想.NET平台的诞生和X#语言的初见端倪完全可以说明问题。
换言之,在我们掌握一门新技术的同时就又有更新的技术产生,身为当代的大学生应当有
紧跟科学发展的素质。举个例子,就像有些同学总说,我做网页设计就喜欢直接写html,
不愿意用什么Frontpage,Dreamweaver。能用语言写网页固然很好,但有高效的手段你为
什么不使呢?仅仅是为了显示自己的水平高,unique? 我看真正水平高的是能够以最快的
速度接受新事物的人。高级程序设计语言的发展日新月异,今后的程序设计就像人们在说
话一样,我想大家从xml中应是有所体会了。难道我们真就写个什么都要用汇编,以显示
自己的水平高,真是这样倒不如直接用机器语言写算了。反过来说,想要以最快的速度接
受并利用新技术关键还是在于你对计算机科学地把握程度。
计算机技术牵扯的内容更为广泛些,一项一项说恐怕没个一年半载也说不清。我只想提醒
大家的还是那句话,技术与科学是不能分家的,学好了科学同时搞技术,这才是上上策。
犹如英语,原先人们与老外交流必须要个翻译,现在满马路的人都会说英语。就连21世纪
英语演讲比赛的冠军都轮不到英语系的学生了。计算机也是一样的,我们必须面对的一个
现实就是:计算机真就只是一个工具,如果不具备其它方面的素养,计算机系的学生虽然
不能说找不到工作,不过总有一天当其他专业性人才掌握了计算机技术后将比我们出色许
多。原因就在于计算机解决的大都是实际问题,实际问题的知识却是我们少有的。单一的
计算机技术没有立足之地。
我想是时候指出:学习每一个课程之前,都要先搞清这一课程的学习目的。这一学科的应
用领域。据我自身所了解到的同龄同学和低年级的同学的学习状况:他们之中很少有人知
道学一个学科的学习目的,期末考试结束了也不知道学这科做什么用。这就失去了读计算
机科学的意义。当然这与现存的教育思想不能说一点关系都没有。
总的来说,从教育角度来讲,国内高校的课程安排不是很合理,强调理论,又不愿意在理
论上深入教育,无力接受新技术,想避开新技术又无法避得一干二净。我觉得关键问题就
是国内的高校难于突破现状,条条框框限制着怎么求发展。我们虽然认识得到国外教育的
优越性,但为什么迟迟不能采取行动?哪怕是去粗取精的取那么一点点。我们需要改变。
从我们自身角度来讲,多数人4年下来既没有学习计算机科学的学术水平,也没有学习计
算机技术的那种韧劲。在我刚上大一时,我的计算机科学入门导师,淮北煤炭师范学院王
爱平教授曾经对我说过这样一番话:“当你选择了计算机这一门科学,就意味着你踏上了
一条不归路,就意味着你一生都要为之奋斗……你的身后是悬崖,只有向前走,不能往后
退。”
有些同学说按照这样学习学的东西太多,有的未见得有用,我想打个形象的比方:学校学
出来的人都是一个球体,方方面面的知识都应具备。可是社会上需要球体的地方很少,反
而需要的是砖和瓦,即精通某一行的人才。但是对于同等体积的物体,用球体来改造是最
方便最省事的。学校的学生很多,为了能够使更多的学生来适应这个社会,学校也就不得
以把所有的学生都打造成一个球体,然后让社会对这些学生进行再加工,成为真正能够有
用的人才。即使你非常清楚自己的将来要干什么,并且非常下定决心要走自己的路,这一
步你也必须走,世界是在不断变化的,你不能预料未来。想清楚,努力去干吧!
必须结束这篇“胡侃”了,再侃下去非我力所能及。其实计算机还有很多基础课都值得一
侃。怎奈我造诣有限,不敢再让内行耻笑。对于博大精深的计算机科学,我只能说我永远
都是个Beginner.最后声明:这些只针对本科阶段的学习。即使把这些全弄通了,前面的路
还长,计算机科学需要我们为之奋斗......学习计算机科学需要韧性,更需要创新,需要
激情。深刻学习理论知识,勇于接受新技术的挑战,这才是我们这一代人应具有的素质。
最后送大家一句话“Wake up every day with a feeling of passion for the
difference technology will make in people's life!”。
P.S.
在我大一时无意中找到了南京大学网友sir的帖子“胡侃(理论)计算机学习”,这个帖
子对我的大学生活起了至关重要的作用,也因此同他成为了好友,本帖子在原有帖子的基
础上改进了其中我认为不太合适的理论,修正了一些观点,在推荐教材方面结合我的学习
情况有了较大改变。值得一提的是增加了一些计算机理论的内容,计算机技术的内容结合
我国的教学情况和我们学习的实际情况进行了重写。感谢大家的支持,这篇文章才能比较
快的完成,这里也只是写下了我在学习计算机科学时的所思所想,很不成熟。与原文相比
增加了一些推荐参考书,删去了一些过陈旧的难以找到的材料。并且对一些问题作了更为
详细地阐述,也增加了一些新观点。希望大家多多讨论,改进不足,让我们共同努力吧!
2016年10月26日 星期三
線性代數 Lec02 學習筆記
$\mathbf{V} = \{(a, b) : a, b \in\mathbb{R}\}$
$\mathbf{F} = \mathbb{R}$(Real)
Addition: $ x = (x_1, y_1), y = (x_2, y_2), x + y = (x_1 + x_2, y_1 + y_2)$
Scalar multiplication: $ x = (x_1, y_1), \alpha x = (\alpha x_1, \alpha y_1)$
$\mathbf{V}$ is a Vector space
$$
$\mathbf{F} = \mathbb{R}$(Real)
Addition: $ x = (x_1, y_1), y = (x_2, y_2), x + y = (x_1 + x_2, y_1 + y_2)$
Scalar multiplication: $ x = (x_1, y_1), \alpha x = (\alpha x_1, \alpha y_1)$
$\mathbf{V}$ is a Vector space
$$
2016年8月4日 星期四
作者:果程C
链接:https://www.zhihu.com/question/22298352/answer/50940942
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
链接:https://www.zhihu.com/question/22298352/answer/50940942
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
对于初学者,我推荐用复利的例子来理解卷积可能更好理解一些:
小明存入100元钱,年利率是5%,按复利计算(即将每一年所获利息加入本金,以计算下一年的利息),那么在五年之后他能拿到的钱数是
,如下表所示:
将这笔钱存入银行的一年之后,小明又往银行中存入了100元钱,年利率仍为5%,那么这笔钱按复利计算,到了第五年,将收回的钱数是
,我们将这一结果作为新的一行加入上面的表格中:
以此类推,如果小明每年都往银行中存入新的100元钱,那么这个收益表格将是这样的:
可见,最终小明拿到的钱将等于他各年存入的钱分别计算复利之后得到的钱数的总和,即:
用求和符号来简化这个公式,可以得到:

在上式中,
为小明的存钱函数,而
为存入银行的每一笔钱的复利计算函数。在这里,小明最终得到的钱就是他的存钱函数和复利计算函数的卷积。
为了更清晰地看到这一点,我们将这个公式推广到连续的情况,也就是说,小明在从
到
的这一段时间内,每时每刻都往银行里存钱,他的存钱函数为
,而银行也对他存入的每一笔钱按复利公式计算收益:
,则小明到时间
将得到的总钱数为:

这也就是卷积的表达式了,上式可以记为
。
相信通过上面这个例子,大家应该能够很清晰地记住卷积公式了。下面我们再展开说两句:
如果我们将小明的存款函数视为一个信号发生(也就是激励)的过程,而将复利函数
视为一个系统对信号的响应函数(也就是响应),那么二者的卷积
就可以看做是在
时刻对系统进行观察,得到的观察结果(也就是输出)将是过去产生的所有信号经过系统的「处理/响应」后得到的结果的叠加,这也就是卷积的物理意义了。
小明存入100元钱,年利率是5%,按复利计算(即将每一年所获利息加入本金,以计算下一年的利息),那么在五年之后他能拿到的钱数是
将这笔钱存入银行的一年之后,小明又往银行中存入了100元钱,年利率仍为5%,那么这笔钱按复利计算,到了第五年,将收回的钱数是
以此类推,如果小明每年都往银行中存入新的100元钱,那么这个收益表格将是这样的:
可见,最终小明拿到的钱将等于他各年存入的钱分别计算复利之后得到的钱数的总和,即:
用求和符号来简化这个公式,可以得到:在上式中,
为了更清晰地看到这一点,我们将这个公式推广到连续的情况,也就是说,小明在从
这也就是卷积的表达式了,上式可以记为
相信通过上面这个例子,大家应该能够很清晰地记住卷积公式了。下面我们再展开说两句:
如果我们将小明的存款函数视为一个信号发生(也就是激励)的过程,而将复利函数
訂閱:
文章 (Atom)