数据科学基础 (Fall 2025)
This is the webpage for the Foundations of Data Science (数据科学基础) class of Fall 2025. Students who take this class should check this page periodically for content updates and new announcements.
Announcement
- 新学期第一堂课:2025年8月29日,苏教楼C204。
Course info
- Instructor :
- 刘明谋:<lmm@nju.edu.cn>,南雍-西229
- Teaching assistant:
- Class meeting:
- 周五:2pm-5pm,苏教楼C204
- Office hour:
- 周四:3pm-5pm,南雍-西229(刘明谋)
- QQ群: 1019436733(申请加入需提供姓名、院系、学号)
Syllabus
课程内容分为三大部分:
- 经典概率论:包括概率空间、随机变量及其数字特征、多维与连续随机变量
- 概率与计算:包括测度集中现象,概率法,离散随机过程三部分
- 数理统计:包括参数估计、假设检验、贝叶斯估计、方差分析、相关性及回归分析等统计推断内容。
对于第一和第二部分,要求清楚掌握基本概念,深刻理解关键的现象与规律以及背后的原理,并可以灵活运用所学方法求解相关问题。对于第三部分,要求熟悉数理统计相关的基本概念,以及典型的统计模型、统计推断方法。
经过本课程的训练,学生将能够掌握概率论和统计学的基本理论和方法,具备处理和分析实际数据的能力,为后续学习数据挖掘、机器学习、大数据技术等数据科学相关领域打下坚实基础。本课程采用课堂讲授、案例分析和课后练习相结合的教学方式,注重理论与实践相结合,培养学生运用所学知识解决实际问题的能力。通过本课程的学习,学生将能够具备扎实的数学基础,为未来从事数据科学研究和实践奠定坚实基础。
教材与参考书 Course Materials
- [BT] 概率导论(第2版·修订版),[美]伯特瑟卡斯(Dimitri P.Bertsekas)[美]齐齐克利斯(John N.Tsitsiklis)著,郑忠国 童行伟 译,人民邮电出版社(2022)。
- [MU] Probability and Computing: Randomization and Probabilistic Techniques in Algorithms and Data Analysis, by Michael Mitzenmacher, Eli Upfal; Cambridge University Press; 2nd edition (2017).
- [GS] Probability and Random Processes, by Geoffrey Grimmett and David Stirzaker; Oxford University Press; 4th edition (2020).
- [BHK] Foundations of Data Science, by Avrim Blum, John Hopcroft, and Ravindran Kannan; Cambridge University Press (2020).
成绩 Grading Policy
- 课程成绩:本课程将会有若干次作业和一次期末考试。最终成绩将由平时作业成绩和期末考试成绩综合得出。
- 迟交:如果有特殊的理由,无法按时完成作业,请提前联系授课老师,给出正当理由。否则迟交的作业将不被接受。
学术诚信 Academic Integrity
学术诚信是所有从事学术活动的学生和学者最基本的职业道德底线,本课程将不遗余力的维护学术诚信规范,违反这一底线的行为将不会被容忍。
作业完成的原则:署你名字的工作必须是你个人的贡献,作业中必须明确标注任何不是由你完成的部分,特别是由AI生成的部分,否则就涉嫌抄袭。在完成作业的过程中,允许讨论,前提是讨论的所有参与者均处于同等完成度。但关键想法的执行、以及作业文本的写作必须独立完成,并在作业中致谢(acknowledge)所有参与讨论的人。符合规则的讨论与致谢将不会影响得分。不允许其他任何形式的合作——尤其是与已经完成作业的同学“讨论”。
本课程将对剽窃行为采取零容忍的态度。在完成作业过程中,对他人工作(出版物、互联网资料、其他人的作业等)直接的文本抄袭和对关键思想、关键元素的抄袭,按照 ACM Policy on Plagiarism的解释,都将视为剽窃。剽窃者成绩将被取消。如果发现互相抄袭行为, 抄袭和被抄袭双方的成绩都将被取消。因此请主动防止自己的作业被他人抄袭。
学术诚信影响学生个人的品行,也关乎整个教育系统的正常运转。为了一点分数而做出学术不端的行为,不仅使自己沦为一个欺骗者,也使他人的诚实努力失去意义。让我们一起努力维护一个诚信的环境。
Assignments
- TBA
Lectures
- TBA
Concepts
- Interpretations of probability
- History of probability
- Example problems:
- Probability space
- Classical and goemetric probability
- Union bound
- Conditional probability
- Independence
- Random variable
- Random vector
- Some discrete probability distributions
- Balls into bins model
- Random graphs
- Expectation