从本期开始,我们将推出系列国内代表性高校的数据科学、大数据和人工智能专业介绍。这项工作旨在加强院校间了解,搭建全国交流平台,共同推进高校大数据和人工智能人才培养工作。同时组建高校教师微信交流群,进群请在本公众号后台回复关键词“大数据专业交流群”。
一、专业简介
数据科学综合运用统计学、计算机科学、应用数学等学科提供的现代数据分析工具和方法从数据中自动寻找规律或者有价值的信息。具体地,它是运用概率统计、并行与分布式计算、人工智能、机器学习等综合知识研究来自工业、生物医疗、金融证券和社交网络等众多领域的较大规模或结构复杂数据集的高效采集、高效存储、高效管理、精确建模、深入分析和精准预测的新兴交叉学科。
二、专业培养要求、目标
本专业致力于培养掌握数学、计算机、统计等数据科学相关领域基础理论知识,以及数据建模、机器学习、并行与分布式计算、统计推断等方法和技术,从事数据建模、数据分析与挖掘算法等问题的研究和大数据系统开发的研究型和技术型人才。毕业生可在科研机构或高校继续深造、从事数据科学相关的科研工作,也可在生物、金融、交通、医疗等自然科学和社会科学领域或业界从事大数据的采集、管理、分析与处理方面的工作。
三、授予学位
理学学士
四、学分要求与课程设置
总学分:132-138学分,其中:
- 公共与基础课程40-46学分;
- 核心课程29学分;
- 限选课程32学分;
- 通识与自主选修课程31学分;
并须同时满足下列选课要求:
- 1) 公共与基础课程:40-46学分
大学英语系列课程(2-8学分),政治系列课程(14学分),计算机系列课程(6学分),体育系列课程(4学分),数学分析(14学分)
- 2)核心课程:29学分
高等代数Ⅰ(5学分),高等代数Ⅱ(4学分),几何学(5学分),抽象代数(3学分),复变函数(3学分),常微分方程(3学分),机器学习基础(3学分),概率论(3学分)
- 3)限选课程:32学分
- (a) 理论基础模块:实变函数或实变与泛函、微分几何、拓扑学、数理统计、偏微分方程、测度论、凸优化;
- (b) 算法与技术模块:深度学习:算法与应用、强化学习、数据科学导论、人工智能、大数据分析中的算法、应用多元统计分析、应用时间序列分析、应用回归分析、数理逻辑、算法设计与分析、集合论与图论、程序设计技术与方法、程序设计实习、数据库概论。
- a) 专业必选课程(6学分):计算方法B,并行与分布式计算基础
- b) 限选课程: 在下列课程中选修15学分
- c) 毕业论文3学分
每个学生在第三学年或第四学年里须参加毕业论文讨论班或者经批准的其它形式的科研训练,并在导师指导下写出论文、读书报告或实习实践报告,通过考核后获得3学分。参加毕业论文讨论班的学生须在导师指导下进行科研训练或者到经批准的企事业单位、科研院所或学校实习实践至少100小时。进行科研训练或参加实习实践活动不应影响其它课程的学习。学院鼓励学生利用寒暑假期进行科研训练或实习实践活动。
- d)理学部的非数学学院课程8学分,其中要求物理类课程4学分。
a) 理学部及信息与工程科学部课程12学分: 可以选自理学部及信息与工程科学部中的任何院系,包括数学学院和信息科学技术学院。除专业限选课外,以下课程可以作为自主选修课程参考:自然语言处理导论、统计学习、计算机系统导论、生物统计、计算机图象处理或图像处理、计算机网络、数字信号处理、模式识别导论或模式识别、计算机图形学、现代信息检索导论、程序设计语言、时空数据分析、可视化与可视计算概论。
b) 通选课:12学分,其中社会科学类至少2学分;哲学与心理学类至少2学分;历史学类至少2学分;语言学、文学、艺术与美育类至少4学分,其中大学国文必选,另一门是艺术与美育类课程;数学与自然科学类和社会可持续发展类至少2学分。“本院系开设的通选课不得计入毕业所需学分。”
c) 在全校课程中选择其余7学分。
- 通识与自主选修课程31学分
五、其他要求
1. 保研要求
专业限选课中任选三门、数学分析、核心课程以及专业必选课进行简单求和作为保研专业排名的依据。
2. 读研准备
保送为硕士研究生的学生在硕士生入学前的两年内选修的数学学院研究生课程,考试成绩在70分以上,且学分没有计入本科毕业学分的,可以计为研究生阶段成绩,获得相应学分。但需本人申请、导师同意、主管院长批准。这种成绩不能超过9学分。
课程列表
1. 公共与基础课程40-46学分
课程号 | 课程名 | 周学时 | 学分 | 开课学期 |
大学英语系列课程 | 2-8 | 全年 | ||
04031650 | 思想品德修养与法律基础 | 2 | 2 | 全年 |
04031660 | 中国近代史纲要 | 2 | 2 | 全年 |
04031730 | 毛泽东思想与中国特色社会主义理论体系概要 | 3 | 4 | 全年 |
04031740 | 马克思主义基本原理概论 | 2 | 3 | 全年 |
04031750 | 形势与政策 | 1 | 1 | 全年 |
00131410/04831410 | 计算概论/计算概论(B) | 3 | 3 | 春季 |
00131420/04831420 | 数据结构/数据结构与算法(B) | 3 | 3 | 秋季 |
60730020 | 军事理论 | 2 | 2 | 秋季 |
―――― | 体育系列课程 | - | 4 | 全年 |
00132301 | 数学分析(I) | 6 | 5 | 秋季 |
00132302 | 数学分析(II) | 6 | 5 | 春季 |
00132304 | 数学分析(III) | 5 | 4 | 秋季 |
2. 核心课程29学分
课程号 | 课程名 | 周学时 | 学分 | 开课学期 |
00132321 | 高等代数(I) | 6 | 5 | 秋季 |
00132323 | 高等代数(II) | 5 | 4 | 春季 |
00135450 | 抽象代数 | 3 | 3 | 秋季 |
00132341 | 几何学 | 6 | 5 | 秋季 |
00131300 | 概率论 | 3 | 3 | 春季 |
00132320 | 复变函数 | 3 | 3 | 春季 |
00132340 | 常微分方程 | 3 | 3 | 春季 |
00130200 | 数学模型(数据科学专业为机器学习基础00137170) | 3 | 3 | 春季 |
3. 限选课程32学分
课程号 | 课程名 | 周学时 | 学分 | 开课学期 | 开课院系 |
00132370 | 实变函数 | 3 | 3 | 秋季 | 数学学院 |
00136830 | 实变与泛函 | 4 | 4 | 秋季 | 数学学院 |
00132310 | 微分几何 | 3 | 3 | 秋季 | 数学学院 |
00132330 | 偏微分方程 | 3 | 3 | 秋季 | 数学学院 |
00132350 | 泛函分析 | 3 | 3 | 春季 | 数学学院 |
00130161 | 拓扑学 | 3 | 3 | 春季 | 数学学院 |
00130190 | 微分流形 | 3 | 3 | 秋季 | 数学学院 |
00136880 | 数论基础 | 3 | 3 | 春季 | 数学学院 |
00136870 | 群与表示 | 3 | 3 | 秋季 | 数学学院 |
00136890 | 基础代数几何 | 3 | 3 | 春季 | 数学学院 |
00132610 | 密码学 | 3 | 3 | 春季 | 数学学院 |
00135460 | 数理统计 | 3 | 3 | 秋季 | 数学学院 |
00133090 | 应用随机过程 | 3 | 3 | 秋季 | 数学学院 |
00133050 | 应用多元统计分析 | 3 | 3 | 春季 | 数学学院 |
00133010 | 测度论 | 3 | 3 | 春季 | 数学学院 |
00133030 | 统计计算 | 3 | 3 | 秋季 | 数学学院 |
00133020 | 抽样调查 | 3 | 3 | 春季 | 数学学院 |
00133070 | 应用时间序列分析 | 3 | 3 | 秋季 | 数学学院 |
00133110 | 应用回归分析 | 3 | 3 | 秋季 | 数学学院 |
00135220 | 非参数统计 | 3 | 3 | 春季 | 数学学院 |
00110710 | 试验设计 | 3 | 3 | 春季 | 数学学院 |
00137110 | 应用随机分析 | 3 | 3 | 春季 | 数学学院 |
00132100 | 应用生存分析 | 3 | 3 | 秋季 | 数学学院 |
贝叶斯统计 | 3 | 3 | 不定 | 数学学院 | |
00102892 | 统计学习 | 3 | 3 | 秋季 | 数学学院 |
生物信息学方法和应用 | 3 | 3 | 不定 | 数学学院 | |
00130550 | 数值代数 | 3 | 3 | 秋季 | 数学学院 |
00130560 | 数值分析 | 3 | 3 | 秋季 | 数学学院 |
00136720 | 大数据分析中的算法 | 3 | 3 | 春季 | 数学学院 |
00130640 | 流体力学引论 | 3 | 3 | 春季 | 数学学院 |
00135520 | 偏微分方程数值解 | 3 | 3 | 春季 | 数学学院 |
00130630 | 最优化方法 | 3 | 3 | 秋季 | 数学学院 |
00136660 | 凸优化 | 3 | 3 | 秋季 | 数学学院 |
00130730 | 数理逻辑 | 3 | 3 | 秋季 | 数学学院 |
00135040 | 程序设计技术与方法 | 3 | 3 | 秋季 | 数学学院 |
00135290 | 集合论与图论 | 3 | 3 | 春季 | 数学学院 |
00135050 | 理论计算机科学基础 | 3 | 3 | 春季 | 数学学院 |
00130030 | 信息科学基础 | 3 | 3 | 春季 | 数学学院 |
00130830 | 数字信号处理 | 3 | 3 | 秋季 | 数学学院 |
00130210 | 计算机图像处理 | 3 | 3 | 春季 | 数学学院 |
00110060 | 算法设计与分析 | 3 | 3 | 秋季 | 数学学院 |
00130210 | 计算机图形学 | 3 | 3 | 春季 | 数学学院 |
04830210 | 软件工程 | 3 | 3 | 不定 | 信息学院 |
04830470 | 操作系统B(含实习) | 4 | 3 | 不定 | 信息学院 |
00132830 | 金融数学引论 | 3 | 3 | 秋季 | 数学学院 |
00135810 | 寿险精算 | 3 | 3 | 春季 | 数学学院 |
00131280 | 证券投资学 | 3 | 3 | 春季 | 数学学院 |
00130990 | 非寿险精算 | 3 | 3 | 数学学院 | |
00135480 | 风险理论 | 3 | 3 | 春季 | 数学学院 |
00136730 | 衍生证券基础 | 3 | 3 | 春季 | 数学学院 |
00134330 | 金融经济学 | 3 | 3 | 秋季 | 数学学院 |
00136760 | 金融数据分析导论 | 3 | 3 | 秋季 | 数学学院 |
00131100 | 金融时间序列分析 | 3 | 3 | 数学学院 | |
00110950 | 人工智能 | 3 | 3 | 春季 | 数学学院 |
04831750 | 程序设计实习 | 4 | 3 | 春季 | 信息学院 |
04830220 | 数据库概论 | 3 | 3 | 秋季 | 信息学院 |
04830050/04831420 | 数据结构与算法(A)/(B) | 4 | 3 | 秋季 | 信息学院 |
00113550 | 信息安全 | 3 | 3 | 数学学院 | |
00114250 | 机器学习 | 3 | 3 | 数学学院 | |
新开课 | 信息论 | 3 | 3 | 春季 | 数学学院 |
新开课 | 网络空间安全 | 3 | 3 | 秋季 | 数学学院 |
新开课 | 机器学习基础 | 3 | 3 | 春季 | 数学学院 |
00130280 | 计算方法B | 3 | 3 | 秋季 | 数学学院 |
新开课 | 并行与分布式计算基础 | 3 | 3 | 秋季 | 数学学院 |
00137130 | 深度学习:算法与应用 | 3 | 3 | 春季 | 数学学院 |
08408010 | 强化学习:理论与算法 | 3 | 3 | 春季 | 数学学院 |
04630790 | 数据科学导引 | 3 | 3 | 秋季 | 元培学院 |
通选课选课相关规定
通选课需要修满12学分。可以用专业必修课和限选课替代通选课相应领域学分。
跨学科选修其他专业必修课和限选课,经学校认定后可计入相应领域的通选课学分,每门课程只能计入一次课类,不能重复使用。本院系开设的通选课不得计入学生毕业所需的通选课学分。
通选课相关领域课程与院系专业必修课和限选课对应的基本原则如下,若认定中有争议或特殊问题,需要经过学校教学指导委员会讨论决定。
- A.数学与自然科学类 (对应除心理系的理工科各院系专业必修课和限选课)
- B. 社会科学类:至少2学分(对应政管学院、国关学院、法学院、经济学院、光华学院和社会学系的专业必修课和限选课)
- C. 哲学与心理学类:至少2学分(对应哲学系和心理学系的专业必修课和限选课)
- D. 历史学类:至少2学分(对应历史系、考古文博学院专业必修课和限选课)
- E. 语言学、文学、艺术与美育类:理科至少4学分(文科至少2学分),至少一门是艺术与美育类课程(对应中文系、外国语学院和艺术学院的专业必修课和限选课,艺术与美育类课程对应艺术学院的专业必修课和限选课)
- F. 社会可持续发展类 (对应地空学院、城环学院和环工学院的专业必修课和限选课)
其中,A类和F类相加:理科至少2学分,文科至少4学分
注:本文内容来源北京大学数学学院官网。
扫码进群,如果下列二维码过期,请在本公众号后台回复关键词“大数据专业交流群”。