跳转至

人工智能新生指南v2.0.0

Written by Axi

本文提供了一种功利看待大学生活的视角,这种视角仅供参考并且不值得推荐,笔者希望你能在这纯粹的功利中找到自己的人文价值所在,享受你的大学生活。

你是希望向上,还是希望向下?

前言

一直以来都很想要写些什么,但又不知道要从何说起,笔者来到西安交大已经两年时间,距离保研还有一年时间,对于大多数的读者来说,这篇内容作为整个教程的第一段,或许确实是前言,那就对于本人来说,可能已经算是一个将尽的句号。

前言里面可能大多数是啰嗦的废话,假如读者不愿去看,可以跳过,而那些愿意留下来的朋友,请让我讲述一下为什么写作这篇内容的理由。

回忆起当初,笔者也和各位一样,对于来到新的学校新的环境十分兴奋,在新生群里面沉迷水群,并且加入了娱乐向的社团。不可否认的,那一段的时间确实十分快乐,还有同时还伴随着对于前途对于学业对未来的焦虑。西交很好,但是或许还不够好,我们都看着远方,期盼着远方。

笔者在大学经历过许多事情,竞选过班委,担任过轻音音乐社的干部,参加过RoboMaster机器人队也拿过国奖,水过几个其他的科技类比赛,参加过科研,发表过顶会,考过优秀的成绩,也主持过开源项目获得上百Star,分享过复习整理并被老师放入复习大纲。笔者写作这些内容的时候是大二下的暑假,可以说这也是大学四年中的一个重要转折点,回顾过去,笔者可以骄傲的说,自己的两年时光还算充实,成果还算丰富,也对得起付出的努力。但若是彻底的回忆,一路走来的艰辛与困难,令人印象深刻的依然是每一次自我提升的过程,以及对于信息的整理。

我在大一结束的时候,有不少的新生前来向我请教,包括学习社团生活科研竞赛的种种经验,我当时便放出过这个论断,大学最大的差距不是天赋,不是努力,而是信息差。

不同于高中生成长路线的单一,及拜诸多辅导机构所赐,网络上或现实中均充斥着大量的有用信息,大学的信息依然繁杂,但是质量却参差不齐。

如何在令人目不暇接的丰富大学活动中找到属于自己的路?这是一个问题。太多的科目需要时间投入,太多的技能需要时间锻炼,太多的比赛需要时间打磨,太多的科研需要时间精进,而在这些时间之外,或许还需要休闲与娱乐,我们的时间又太少了。

笔者无意定义怎样的履历才是成功的大学生活,但即使是最极端的摆烂主义者,也很难不承认成绩以及科研竞赛成果,是决定未来就业或是升学的重要且几乎唯一的衡量标准。信息差使得我们并不能很好地分辨性价比,无数的同学将时间投在竞赛中,但最后的成果是被他人随意的标记为水赛;无数的同学将自己的时间投入在科研实习中,但负责的工作确实是重复的数据清洗,换来不知名期刊靠后的挂名。

一旦想到有无数的同学被埋没在本不属于他们的名利场中,我便发自内心的感到担忧:每位西交学子都是自三年苦读才来到了这里,而努力不应被辜负。

上海交大生存指南是上交学子推出的适用于上交新生的指导向内容,其中的大量内容极具启发性,笔者也是在进行了充分阅读之后,萌生了写作本教程的想法。一本开源的面向全体新生的教程指南,旨在降低不同学生之间的信息差,指导大家应该如何更好的在大学中学习生活并提升自我,这便是本教程写作的初衷。

不可否认的是,本教程中出现存在大量显而易见的明显性缺陷,其中包括但不限于对科研竞赛的纯粹功利主义评价,对于对待培养方案内课程的不标准处理,以及大量仅根据他人评价给出的一家之言的论断。但是幸运的是,得益于开源社区的存在,本教程内一切内容均受到每一名读者的监督与建议,一切的客观内容均会在后续的改进中得到更全面的完善,并且在纯粹的功利主义之外,加入更多的人文关怀。

其实不应放入前言,但仍有必要提及的是,本教程中对于部分内容的性价比评价可能是伤人的,大量的在读同学将自己宝贵的心血投入其中,但或许因为笔者的一家之言,导致将来的新生血液骤减,或者对自身努力成果的评价被降低,这是很可能产生的副作用。下单的方式是对本项目提出Pull Request,纠正这种偏见,并且指引新生加入,这是本项目所鼓励的,但在此之外,笔者可以多半确认的是,对于教程中提及内容的价值评估,与外界基本相同。

愿努力不被辜负,你我共勉。

入学的准备

希望你踏入校园之前,已经是一位成熟的人,我们希望阅读本指南的人了解一些生活的常识,具有正常人拥有的三观,并且具有独立发现并解决问题的能力。

学生群

在入学之前与之后,你可能会接触到新生群在内的一系列新生群体,在西安交通大学中大多数的联络工作通过QQ展开,而仅有少数的课程群使用微信创建(这得益于QQ的群文件(较小的)不存在过期,而课件等内容通常需要长时间的保存/QQ群支持更多的群成员人数上限)。这些之中有一些是你需要注意的:

  • 新生群:官方会开设一系列的新生群,但是其中大多数是无意义的吹水,作为让你向往大学的心开始激荡很不错,但是实际上的意义不大。
  • 专业新生群:一般由一些同学自觉组建,之后群中会迎来辅导员在内的一些人,会带来一些你需要的通知,专业新生群在一段时间过后可能会被冷落,或者被转换为年级群,这均是有可能的。其中部分有价值的信息比如:
    • 到校时间
    • 部分行政内容
    • 一些特殊提醒
  • 班级群:班级群会一直陪伴你,包括了你全部的同学,后面会加入你的班主任以及辅导员。大多数时候,班级群中充斥着通知,并不会经常有要事/讨论发生。
  • 年级群:同理。
  • 专业群:对于人工智能专业而言,我们有自己的专业群,需要实名认证加入,其中包括历来全部的学长。专业群是仅包含学生的交流群,其中包括绝大多数的复习课件以及其他的有价值的信息。因为AI学组的建立,部分的学习资料被转移至学组群/在学组群中被发布。
  • 学粉群:包含了无数的学习的内容(书籍的电子资源/复习资料),西交的各个学生组织(学习辅导团/学辅为主)组织了有效的学习资料,你一定会用到它们的。学粉群按照年级次序进行更新,每一年均会建立新的学粉群,并同步过往的资料。

携带的东西

对于开学需要带什么,常常会引起新生的焦虑,但是事实上携带必要的证件以及衣物是唯一需要注意的,而无需执着于一些细枝末节的内容。一般来说 2000 元的启动资金可以解决绝大多数的问题,部分过于零散的内容并没有必须携带的必要,而少数必须写但剩下的东西稍微邮寄一下也是可以的。

其中证件或许包括:

  • 高考准考证
  • 录取通知书
  • 户口本+身份证复印件(若无转户口需要,户口本可不带)
  • 个人证件照若干(建议自己存有各种底色以及常见尺寸的电子版,平时为蓝色,党团相关为红色)
  • 毕业高中所发的档案袋(包括但不限于团组织关系、学籍卡,档案袋,请注意保证封条完整性)

同时,对于床上用品,其尺寸如下:

品名 产品规格(米) 重量(千克)
被套 \(2.15\times 1.5\)
床单 \(2.2\times 1.1\)
棉被 \(2.1\times 1.5\) \(2-2.5\)
棉褥/床垫 \(2.0\times 0.9\) \(2-2.5\)

实际上可以使用大多数的3cm乳胶床垫均是不错的选择,比棉褥舒服且高度适宜。

这一类内容大量出现在新生群的讨论中,更多内容可以前往新生群进行咨询,本指南的重点并不在于指引新生完成入学的报道环节。事实上,入学的信息量并不大,也并不存在信息壁垒,在新生群中,大量的老生会为新生带来第一时间的答疑,这也可以很好的锻炼读者的信息整理能力。

报道相关

虽然说各种教程中会给出你交的地图,但是实际上没有任何的意义,毕竟也背不下来(反正我这种路痴是不可以)。

不过在入校的大多数时候,校园里流窜着大量老东西志愿者,直接抓过来问路就好。

你可能需要做的事情是:

  • 办理入学手续以及报道:志愿者会帮助你完成一切事情,忘记或者就是懒得带身份证复印件的可以一路问路到康桥三楼打印店进行复印。
  • 开通空调:看地图或者问路,那里人很多。
  • 购买桶装水(和空调在一个地方,同时不建议买饮水机和水泵,笔者当时领到的有点脏,网购一个电动的水泵省力且好用)。
  • 搬行李(狠狠压榨志愿者,他们做志愿会获得大量工时,不压榨就亏本了,别心存愧疚)

开学考

开学考主要作为非实验班(真正意义上的实验班)学生考入实验班的选拔方式,作为人工智能实验班的同学,读者无需在开学考中考出任何的成绩,这些成绩既不会影响你的绩点,也不会改变你的分班结果(英语授课将统一进行,参加钱院H英语,其在四六级考试的优先度上等价于A班,本身具有B班的部分教学内容,同时考试难度较低)。

开始生活的选项们

有必要做的事情

想要在西交进行顺利的生活,或许需要进行以下的几项准备工作,其中包括:

  • 下载移动交通大学并且注册好自己的账号与邮箱。
  • 在网络中心办理入网。详情见网络中心的教程

完成这些工作,你基本上就可以在西交畅通无阻了。

不推荐做的事情

与此同时,一些事情是不被推荐的。

开学1100大礼包

售价1100元的大一全套书籍被戏称为开学大礼包,实际上尽管你的家庭可能比较富裕,但是在网上单价购买你需要的书籍也会比1100更加的便宜(在大礼包“折扣”的背后是你会收到包括西迁精神、英文版论语等只能陶冶情操的书籍),更何况你可以选择使用电子书(免费)或者购买二手书籍(100~200元,捡漏或者联系学长或许能获得更低价)。

办理电话卡

任何理由任何形式的办理电话卡都是没有必要的,除非你真的没有电话卡。

办理电话卡不会有低价不会有优惠不会对你有任何的帮助,特别是对于入校园网,使用你本身的电话卡即可,除非你想要支持电信事业发展。

关于人工智能专业

在介绍之前,需要先说明西安交通大学的行政制度:书院学院制,简单来说,书院负责生活相关,学院则负责学习。举例来说,奖学金的评比属于书院,各种的活动属于书院,而个人的教学培养方案以及各种成绩的设定属于学院。

人工智能班属于钱学森书院以及人工智能学院。

属于钱学森书院意味着享受钱学森书院独有的淘汰机制,也就是假如说一学年三科低于70分或者一科低于60分,就会被淘汰,这种淘汰并非末位淘汰,但是因此掉以轻心而被淘汰的人不在少数,作为一个参考的数字是2022级的大一淘汰人数为11人,原总人数接近80人。

属于人工智能学院则意味着你并不具有钱学森班或者越杰计划的优惠政策,前者具有100%保研率,而后者每个月都会发钱(1500),但是所谓近水楼台先得月,大家可以更便于享有人机所(人工智能与机器人研究所,简单理解为人工智能学院)的科研机会,这一点我们将在后面提及。

学业

无名小卒,还是名扬天下

成绩计算方式

\[ 学分绩 = \sum{\frac {学分}{总学分}\times 成绩} \]

仅计算必修课成绩,选修课成绩仅参与奖学金分配。

四种学生与四种学生

早上好,西交大!昨天的保研排名,最后结果是满打满算的整整三十个!多亏了没完没了的竞赛加分,光数学建模就加了十个。但有一位大佬也加了,我看排名全得下降,因为其他卷怪肯定咽不下这口气。本科科研再次发表顶刊。Rank 遭人赶超,又是 CVPR 干的好事。与此同时,钱学森学院的学辅小组还在重修班上帮挂科摆烂人辅导。而在人机所呢... 好吧... 人机所还是那个人机所。我是你们的铁哥们阿汐。和我一起,开始保研之旅的新一天吧。

因为尚且不清楚本文对于本年级造成的影响,但是依然尝试给出以前常见的情况。

一般来说,我们认为一般来说,刚入学的学生分为以下四类:

  • 深层学习者:他们在大学之前就已经了解了部分相关领域的深入知识,这些人主要来自于少年班以及部分的高中竞赛选手(在此处主要指数学与计算机奥赛)。深层学习者本身可以快速了解大学知识,并且在一些领域中的知识具备更加领先的掌握程度(e.g., 已经学完高数/线代/概率论)。
  • 浅层学习者:他们在大学之前经过相关的了解或者浅层培训,对于大学需要了解的知识有大致的印象,并且了解部分的知识,尤其是编程知识。这些人主要来自于剩余的少年班、竞赛选手以及素质教育普及的地区(或许北京上海等地)。浅层学习者的显著特征是存在较少的知识壁垒,对于他们来说,他们清楚大学中需要学习的知识是什么,并且在计算机领域(如编程)提前有所涉猎
  • 做题家:他们在大学之前仅了解过高考相关的知识,对于电脑的了解仅限于使用 Microsoft 全家桶或者剪辑视频,对于大学知识也仅在报菜名的层面上了解学科的名字,这是绝大多数读者的情况。成为做题家层次的读者并非是一件耻辱的事情,事实上大多数的同学均是从做题家这个阶段进行发展的,然后在学习中取得成功。绝大多数情况下,取得好的成绩并非十分困难的事情,更何况有本指南为你保驾护航
  • 古神:不知道为什么进来的人,一无所知,实力不匹配西交水平,希望不会有这种人。这类学生较为少见,也并非本教程面向的读者。

而在第一学年过后,这些学生则将被分为以下四类:

  • 遥遥领先者:他们在学业的基础成绩上远高于保研线(高大约 4 分以上),并且在课余在其他的方面也有所建树,甚至获奖并获得了保研加分。这部分学生可以着眼于保研外校,或者在其他的课外领域做出拓展。
  • 挣扎者:他们的学业成绩处于保研线的附近(下浮动两分,上浮动四分),这些人在后续可能会无法保研,或者获得保研资格,这是最焦灼的地段,不少的同学也拥有一技之长,希望通过竞赛等方式获得加分。对于这个阶段的同学,获得保研名额依然是当务之急,因此适当的参加可以提供加分的竞赛,并且将主要精力放在课内知识中是十分重要的。
  • 放弃者:这些人的分数已经远离保研线,根据学分绩的计算方式,已经无法在巨大的权重面前挽回自己的分数,要不然沉淀觉醒,要不然准备考研。
  • 被淘汰者:是的,钱院的淘汰制度会淘汰那些三科低于 70 分或者一科低于 60 分的同学,你们不会再见到他们。

本教程的目的是让做题家成为浅层学习者,并且了解之后的学习路线,成为遥遥领先者。

课程的分类

对于基础的课业内容,可以分为以下三类:

  • 思政课:考核以需要大量背诵资料的闭卷考试以及论文为主,课内能水则水,别忘了提交作业即可。
  • 通识课:高数线代概率论大物,这些课程是任何的工科学科都需要学习的,而且占据了大一绝大多数的学分,这些课程的成绩决定了你将来能走的多远,绝对的重中之重。
  • 专业课:一些人工智能专业的专业课,假如按照本文发展顺序一切顺利的话,当你学到这些内容的时候你已经学过一些其中的知识了。

记笔记是一种正反馈

在学习的过程中,首先还是不去讲解学习本身的内容,而是从学习方法入手,在这里需要提及的是记笔记。

笔者不了解读者在高中期间对于记笔记的看法,例如是否会在复习的时候看这些笔记,或者认为记笔记是否是一种累赘,但是在高中的生活中,笔者从来没有记过一行笔记。

尽管如此,笔者依然推荐在大学期间使用记笔记作为最核心的学习方法。

一种广泛的论调是,大学的学习以自学为主,这一点是不可置否的,而在自学的过程中,能否让自己获得持续学习的动力,这成为了自学过程中最关键的一环。

一种常见的现象是,每每开学,无论之前在高中,还是如今的大学,都有很多同学向我咨询学习相关的事宜,仿佛准备大干一场,但是在开学两个月之后,一般他们的朋友圈或者说说又被二次元或者现充生活占据了,而全然不见当初的拼搏模样。有时候学习的难点并不在于如何高效的学习,反而在于更为基础的一点:如何坚持学下去。

假如并非十分自律的人,在学习的过程中,毫无疑问,正反馈是十分重要的。适当的正反馈不但可以让你有学习的动力,也可以让你保持学习的节奏。但是在大学中,正反馈往往不是如此的常见。在不经常存在考试,甚至课程质量良莠不齐的大学当下,在学习中获得的反馈是十分难得的。更加经常的情况是,你有数不尽的内容可以学习(学完课内可以拓展课外知识),但是每每学习结束之后你并不知道自己的学习是否为自己带来了改变,这与高中阶段学习少量的内容,但是在重复性的刷题以验证自己的学习成果不同,而一味地向前冲有时会带来迷茫,从而让读者失去兴趣。

关于笔记的用处,不排除一些人通过记笔记起到加深记忆,以及获得一手的复习资料的作用,但是在此之外,记笔记也是一种记录,如日记一般,可以告诉你:“我今天学习了很多内容”。

在这里也就不难阐述记笔记带来的正反馈了。事实上,正反馈的缺失往往来自于难以对自己的学习成果带来一种定量的总结,这是显而易见的,因为并不存在大量的考试,而学习的内容也远远多于考试的内容。但是通过频繁的记笔记,笔记的字数以及内容的积累可以带来一种最为直观的反馈,尤其是当你自己的笔记从千字到万字再到数十万字的时候,你可以很明显的感知到,如今的自己已经今非昔比。

在这里笔者推荐一款软件 Obsidian(相同/类似的软件有notion以及flowus等),读者感兴趣可以自行了解,作为离线且使用 Markdown 的强大笔记软件,或许你很需要它,但在本文中不展开介绍,将来有机会会单独出教程相关的文章,同样发布在学组中。

两种自学目标

笔者在这里同样给出两种自学的目标,这两种自学的目标的好坏的显而易见的,且他们各自有各自的优劣,读者可以通过自己的理念选择自己合适的方法,但是在这里引用笔者喜欢的游戏《极乐迪斯科》中的成就,别做那个“全世界最可笑的中间派”。

第一种方法是显而易见的,彻底学懂每一个知识,这需要你在学习知识之后使用或刷题或代码的方式对于学习的知识进行实践,这会极大的加深你对于知识的印象,并且让你对知识的掌握变得更好,但是同样令人遗憾的是,实际上即使是这样的学习,假如不及时加以复习,遗忘曲线同样十分的陡峭,也就是说伴随着学习的深入,你会背负越来越多的复习任务,加上本身的学习目标,这会导致你的进度较慢,但是相应的,你对于基础知识的掌握也会较为的扎实,这是很重要的。坚实的数理基础会成为将来你理解一切理论的强大后盾。

第二种方法则稍微有些极端,对每一个知识的掌握停留在“能看懂答案”的程度,这种程度的学习进度会十分的迅速,能够帮助你迅速的了解你需要的大量知识,对于整体知识脉络有一个了解,不过明显,了解的内容会很不扎实。一个弥补是,在下次见到某个问题之后可以说:“我知道用这个知识点可以解决,只是我记不清了”,这可以让你通过查阅资料快速的找回这段记忆,笔者便是使用这种方法。这种方法在一方面显然并不适合应试教育,在考试之前甚至有必要专门耗费一定的时间来捡起过去的知识,但是在实践中(人工智能领域/计算机科学领域中充斥着海量的知识以及大量的实践),再加上如今大语言模型的助力,有的时候,了解一门知识,远比彻底掌握一门知识具有更高的性价比。

不过值得一提的是,无论你使用哪一种方法,适当的实践都是必须的,但是只是有的时候这些实践不是你自己给自己安排的,在恰当的时候他们或许会自己找上门来。

路线

了解一些学习的路线也是一件比较必须的事情。人工智能这一领域的内容从代数到逻辑、从支持向量机到 Agent,无数的算法以及无数的内容等待着你的探索。与此同时,课内依然会提及不少的内容,这些内容,从应用的角度来看大多数是过时的,但是依然能让你对这一领域的基础内容有一定的了解。

首先对于课内讲解的内容进行一个简要的介绍,课内的人工智能相关的内容主要集中于概念以及算法的理解上,同时辅佐以一些部分的上机实验。

其中在大一以及大二你们会接触的主要是“计算机科学与人工智能的数学基础”以及“人工智能的现代方法”这两门课程,但是不得不说的是,这两门课程中的可观的内容是过时的

在大三之后,你会开始接触计算机视觉或者自然语言处理或者机器人学等一系列看上去更加现代的领域,但是老实说,了解更多的学界常见的内容才是更好的选择,这也是本文为何单独设置路线这一章节,而非让读者自行根据人工智能专业的培养方案学习,这一方面是因为培养方案的进度会导致你直到大三才会刚刚开始接触人工智能领域的流行方向的古早算法,另一方面则是这些方案可能并不能很好的满足在本文中提及的竞赛或者科研中对于知识积累的需求。

规避教材有罪论

事实上,我国的大量的教材确实存在编写的结构不够合理,有历史遗留问题等问题,但是事实上,远远达不到难以理解的程度,一本好的教材确实可以让你的学习事半功倍,但是同样破除信息壁垒获得这本教材也同样需要付出用来信息检索的时间成本。在另一方面,即使教材本身存在部分的问题,但是这依然不妨碍读者通过这本教材彻底理解这门学科,并且在考试中取得优胜的成绩。

在任何时刻,抱怨环境总是不应该发生的。虽然说这本身更类似于一句鸡汤,但是在适当的时候确实有其存在的价值。当遇到苦难的时候,长时间的驻留并且抱怨是不应该发生的行为,事实上正确的做法是自己找到合适的教材,或者通过充分的学习理解相应的知识点。作为对环境的一些改变,你可以分享自己在这一过程中获得的信息,帮助他人打破信息壁垒(这也是本文写作的目的之一)。

数学基础

在一切的开始,是一些数学基础。

笔者对于人工智能专业的了解,是从一开始不知道其具体是什么,到认为人工智能实际上是一门数学学科,之后最后认识到了其独特的本质。

尽管人工智能本质上并不是一门数学学科,但是实际上在人工智能这一领域的早期,其依然经常和数学打交道,尤其是与优化算法相关的内容。

你首先需要学习高等数学以及线性代数,其中高等数学中你需要了解基本的偏微分以及积分,同时线性代数你需要对于矩阵的乘法烂熟于心,并且了解一些线性代数的直观解释。

之后你需要了解概率论,概率论是在人工智能这一学科之中十分重要的数学基础,在这一领域学习的将来,你会无数次在各种方法中看见概率论的身影,不过现在,你并不需要完全的学透这门学科,而是将其课内的内容了解大概,并且在后续的学习过程中不断的探索新知识。

事实上高数线代与概率论尽管在互联网的段子中如雷贯耳,但是本身并不困难,假如说有一段富裕的空闲时间,或许仅需要大约三天学习高数上/五天学习高数下/四天学习线代/四天学习概率论,便可以完全的掌握这些科目。

计算机基础

计算机是一切的工具。

众所周知,计算机是人工智能这一领域的最重要基石之一,即使你是一个对于这一领域了解甚少的人,也八成了解过至少人工智能的模型是运行在电脑之上的,因此,了解计算机的基本使用以及增长自己的 Coding 能力也是很重要的一环。

首先是对于电脑的基本使用,我希望你可以学会以下的几件事情:

  • 第一是基本的电脑各种操作,这里指在 Windows 下的使用。基础的各种计算机的操作是必要的一环,假如说甚至在入学之前没怎么接触过计算机,那么恶补相关的知识永远是放在第一位的。
  • 第二是可以合理的描述报错信息。当你在配置电脑的环境或者再进行代码书写,又或者是正在进行其他的事情,而一些地方出现了错误,你需要学会如何妥善的记录这些错误,并且在网上搜索解决方法。寻找身边的计算机高手也是一个很好的解决方案,但是请记住,任何一名 IT 人士对你的帮助假如是无偿的,这意味着你需要妥善的描述你的报错信息。只有当你付出了十分钟来提问,别人才会花十分钟来解决你的问题。这里依然推荐不朽的名著,提问的智慧。今天你可能觉得笔者在文档中要求每位读者学会如何“提问”是一件十分傲慢的事情,然而某一天你在给自己的后辈讲解问题,面对杂乱无章的描述以及一团乱麻的现状,你也会想起这篇名著,并且发送它的链接。

其次是学会编程语言,本文强烈推荐每一位读者将 C++ 作为自己学习的第一门计算机语言,这将帮助你很好的培养自己的编程思维,假如学有余力,可以额外学习 C# 来了解面向对象的魅力。不过在面向深度学习进行编程的过程中,实际上我们最多的会接触 Python。强大的拓展功能,便捷且精妙的语法,以及独有的,其对于深度学习框架的支持:Torch 以及 TensorFlow 或者 MXNet 等著名框架都将 Python 作为首要的发布平台。所以说具备了基本的编程能力之后,你可以将自己的精力尽可能多的投入到 Python 这一语言的学习上,同时学习 Pytorch 这一深度学习框架(Pytorch是当今最热门,设计最合理,最易于上手且功能最为强大的深度学习框架,相较之下其他的框架似乎学习的意义并不大)。

最后,或许你有必要了解一些基本的计算机领域的技能,这些技能或许笔者在将来也会发布较为全面的汇总以及教程,不过在这里也提及部分。比如说笔者用于写作本文的 Markdown 语法,用于版本管理以及参与开源项目的 Git,大多数服务器使用的 Linux 操作系统的命令行语法,远程控制服务器的 ssh,如何登录 GitHub 等网站等。

关于计算机相关的知识,知名开源项目CS自学指南中收录的绝大多数你需要掌握的计算机知识,其推荐的课程十分的优质,但是切勿陷入其中过多,计算机领域的知识终究与人工智能领域的知识存在一定的差异。

深度学习基础

在了解了若干的数学基础以及计算机基础之后,此时本质上你已经可以踏上深度学习的学习之路了,实际上大多数的深度学习的内容是在通过神经网络强大的拟合能力并通过抽象思维创建新的成果,所以并不需要十分深入的数学知识。

你可以在网上查阅相关的教程,了解从 MLP 开始的深度学习的发展历史,以及在这其中的经典算法,从过去直到现在,这其中的算法如此之多,你或许需要很长的时间才可以保证完全学完并且了解,当然,你也可以阅读笔者书写的《简明深度学习教程》(开发中,暂无),不过彻底了解这些内容的同时,我们也同样推荐你伴随着代码的实践,这都很重要。

同时,笔者的另一个项目,AI wiki是一个人工智能的自学指南,其中推荐的内容或许是本教程的补集,可以帮助你从快速入门科研的角度学习深度学习领域的知识。

递归学习

此时,你已经具备了全部的先决条件了,如今你可以踏足深度学习的大门了,在此之前,在深度学习的基础学习部分,你已经了解了绝大多数深度学习领域的主流方向,你大可以选择其中的一个方向,并且在如 arxiv 或者 CVF 上面查看这一领域的最新成果,并且加以阅读。

可以预想到的是阅读这些内容必将伴随着各种抽象的概念以及晦涩的内容,所以在此笔者推荐你使用递归学习这一方法,这能很明显的拓宽你的知识广度,并且帮助你快速到达在某一领域较深的知识深度,具体的方式大致就是,面对不懂的地方,查阅博客或者论文,并且进一步发现不懂的内容,不断地查找下去,直到自己懂的内容,然后开始回溯,一步步向上学习,最后理解这篇论文。

实际上你会发现,绝大多数的论文都是建立在故事线之上,而存在结构性的开创性的创新绝对在少数,但是尽管如此,你依然总结其中 Idea 的精华部分,并且加以学习。

只有阅读足够多的论文,才可以了解更多的内容,并且学习到更多的知识,培养自己的科研品味,这是很重要的。

保研

保研可以说是每一位大学生从功利角度上学习到最后的唯一目标,这是衡量你大学三年的学习成果的考核,通过的话你就可以度过轻松的最后一年的时光,并且进一步的深造(这在当下几乎是必须的)。值得一提的是,事实上令人沮丧的是,保研带来的身体与心理的压力可能会远大于考研,而其最后的升学去向往往也不一定优于考研,但是毕竟保研是更加长期的方案,并不会将一切押注在某一次考试上,这从一种维度上来说也可以算是保研为数不多的优点之一。

尽管如此,笔者依然推荐读者进行保研,一方面来说,保研是一种在学习过程中促使你不断的努力进步的内驱力,同时,假如说可以争取到尽可能高的位置,其去向以及个人的发展前景均是极其优秀的。

概念辨析

在了解如何保研之前,或许你需要知道一些概念。

我们常常听说保研分为本校保研以及外校保研两种,也就是俗称的保本以及保外,而保本的难度会低于保外,但是对其中流程的认知不足可能会带来信息差,这是很致命的(笔者当年认为本校是老师运作,而外校是需要老师直接进行引荐)

保研其本质上是获得推免名额,是你能否免试攻读研究生或者博士生的一张门票。只有获得了推免名额,才可以拥有参加保研/直博的资格,进入国家的推免系统,并且进行志愿的填报,从而参与保研流程,详情会在后续讲解。

不难看出,事实上我们常说的保本校以及保外校其实是同等的,只是说本校一般来说是点击就送(绝大多数的学校,在保研过程中本校学生享有本校保护,这是一种使之不与外校学生同台竞争的保护机制),而当选择外校时,由于通常会选择好于自己的学校,所以更具难度,久而久之产生了一种保本弱于保外的感觉。

一般来说,作为人工智能专业的学生,保研本校无需自己过多的担心,只要正常走完流程即可,而关于保研外校的详细内容,将在下方单独开设章节。

推免资格获取

人工智能专业虽然在钱学森书院,但是因为并不在钱学森学院,因此只享有钱院的淘汰机制,但是并不具有全员保研的优惠政策。

推免资格根据排名先后进行发放,通常会具有公示,在核算了加分之后进行公平公正的排名。人工智能专业的排名为90%智育分+10%德育分的综测成绩,其中90%的智育分之中包括保研加分(如竞赛加分/出国交换加分),每年保研人数占专业总人数50%左右(由于疫情结束,不少同学选择出国,会伴随放弃保研资格,同时少年班同学不占用本50%的保研名额,因此实际比例大于50%)。

德育分每年具有基础分 70 分,详细的加分公告见文末。

成绩是保研的基石

不难看出,在保研的过程中,实际上主要的占比还是来自于智育分的成绩,其中智育分指不包括选修课的成绩部分按照学分绩加权之后得到的结果,这是排名的重中之重。

事实上绝大多数的时候,保研的成功与否都是建立在成绩的基础之上的,而从某种玄学层面来说,第一学年的成绩事关气势,尤为重要。尽管理论来说,即使第一学年失利,在后续的考试中也可以从新获得优胜的名次(毕竟第一学期的学分占比实际上并不是特别高,在平均之下还是可以获得比较好的成绩的),但是事实上往往在第一学年的考试之后,会产生一种潜意识的心理定位,从而影响个人的学习积极性。

在另一方面,需要提及的是好学生效应,即“好学生有可能被请教一些其不了解的问题,从而被迫学习更多的知识,成为真正意义上的更加好的学生”,成为好学生会带来一种外驱的正反馈,这对于成绩的提升带来的助力也是很大的。

按照目前的行情来说,最终保研的平均分数在87-88分左右,而想要稳定获得保研名额,在考虑后面的同学很有可能可以获得保研加分的前提下,很有可能需要保持大于等于91分的分数,才可以被称为稳定获得保研名额。

对于提升成绩的建议将会单独开设章节进行讨论。

竞赛是加分的来源

各类的竞赛是保研加分的主要来源,竞赛一般来说能带来保研加分 1 至 7 分,其中 2 分是一个常见的分数,但是获得竞赛加分的人从来只是少数,不过本文会推荐一些竞赛,这些竞赛具有一定的含金量,并且获奖也稍微容易。同时一些竞赛也可以提供德育分的加分,这远比智育分要简单。

一般来说,在竞赛中获得智育分加分,意味着你获得了保研翻盘制胜的法宝,或者一槌定音的利器,一种更加直观的方式可以用来展示加分带来的效果。以参加机器人队并随队获得全国一等奖为例,可以获得智育分的2分加分,而大三结束后的全部智育学分可能约为100分,相当于获得了200学绩分(一种较为直观的换算方式,为学分乘以分数,称为学绩分)加分,换算过来可以等价于在一门2学分的课中弥补高达100分的分差,这无疑是十分恐怖的。

当然,除此之外,优秀的竞赛还能帮助你获得你需要的能力,因为竞赛往往是前人走过的路,所以其中蕴含着系统的学习路线,这些内容或许对于你自我的提升也很有帮助。

以下是一些推荐的竞赛:

  • XCPC(ACM):本文将XCPC放在竞赛推荐的第一位,一方面算法能力的提升是受益终生的,也是众多竞赛中自我提升最大的竞赛,而在另一方面,对于保研外校来说,XCPC的获奖是唯一依然保有含金量的竞赛,远远有别于其他竞赛。对于参加过高中的奥林匹克信息竞赛的读者来说,XCPC 是 OI 的大学 DLC,但是对于在高中并没有参加过相关竞赛的读者来说,XCPC具有较高的入门门槛。尽管如此,入门XCPC并非毫无可能的,无数优秀的选手均可以在大学入门的前提下获得好成绩。
  • 数学建模(国赛+美赛):数学建模比赛是非常知名的比赛,比赛的流程大约是四/五天时间内由三人团队完成对一系列问题通过数学建立模型并且撰写一篇论文。在其中,或许需要你的编程能力、数学建模能力、分析问题能力、论文写作能力(\(\LaTeX\) 以及作图)。该比赛每年有大量的学生参加,并且不少人均有获奖,可以获得不俗的加分能力。其中美赛是全校范围内加分难度最低的比赛,而且由于不需要提交数据,仅需要提交论文,使得其很大一部分取决于论文写作以及作图能力,具备最低的入门门槛以及最高的获奖概率;而国赛则因为不存在国三而难以获得智育加分,但是依然可以获得较高的德育分加分。
  • 各类机器人比赛(RoboMaster/RoboCon/RoboCup 等):机器人比赛是本文同样强烈推荐的竞赛,可以极大的培养你的各项能力。一般来说,机器人比赛分为机械、电控以及算法组,你可以加入其中的一个小组,比赛通过三个组共同协作完成机器人。在这类机器人比赛中,我往往推荐你参加其中的算法组或者视觉组,这与本专业的内容有较高的重合度。目前据我了解,也是有不少的人工智能专业的同学在其中,可以提供帮助。机器人比赛能锻炼你对于计算机视觉、编程等一系列内容的了解(以及包括Linux系统等一系列计算机技能),并且对于机器人这一系列技术栈具有一个全局的视野。该比赛基本上每年每个队伍都能获得国一,这一般意味着一次 2 分的智育分加分,但是相应的,你需要熬过漫长的培训以及考核,同时在其中投入大量的时间。
  • 腾飞杯/互联网+/挑战网:这一系列的比赛,读者可以寻找具有一定的成果的队伍加入,其本质上是转化科研产出的水赛,但是其含金量虽然远不及前两者,不过依然具有加分能力。通常来说这类比赛可以带来德育分的加分,但是智育分的加分较为少见。

高效的参加一些竞赛被认为是一种获得在排名以及各项活动中的优势的有效途径,它一方面可以丰富你的简历,而另一方面则可以使你获得有意义的技能。

尽管拥有一项自己热爱的竞赛是一件很不错的事情,本文依然不推荐读者在竞赛中带有过多的归属感,因为实际上,竞赛(除了如 XCPC 等永无止境的提升空间的竞赛之外)在经过了开始的快速提升能力的抗压期,接下来的内容就只剩下完善项目或者等待运气降临的平淡期,从功利的角度来看,在这段时间中投入与竞赛中过多的时间,除了消耗个人的精力之外别无他用。

保研以及更遥远的学习之路上,保持自己时刻都在学习新内容才是最重要的。

科研是唯一的含金量

虽然说竞赛,以及各种所谓的大创等等的项目可以给你带来部分的经验(假如你不是为了水竞赛而来的话)以及技术,但是实际上到最后,简历中最为重要的部分,无外乎就是两点:成绩排名 rank 以及科研经历。

鉴于硕士以及博士的主旋律都是进行科研,所以也不难理解,假如说你在此之前已经拥有了科研的经历,必然是可以让别人刮目相看的。科研能力往往是在保研外校的时候最为看重的一点,除此之外也就仅剩下了成绩。在本科期间获得优秀科研成果可以很好的证明你的学术水平,而一到两篇的顶会发表则会为你带来几乎绝对的优势(伴随着现在的保研形式日渐的严峻,内卷严重化,顶会从十分稀少已经变为了较为稀少,在更高的学府甚至更好的课题组中,具有科研经验以及学术成果发表已经几乎成为了一种基本的要求)。

得益于人工智能专业的专业优势,西交大人工智能与机器人研究所(IAIR)的大门时刻将你敞开,你专业课的老师以及班主任大多数都隶属于人机所,一封简单的邮件便可以申请前往这些老师的课题组进行科研实习。

不过值得一提的是,作为大一新生的你,贸然找老师进组科研,并不是一个理智的选择,尤其是对于暂时对于专业知识一无所知的你,一条路线明确的成长曲线可能会更加适合你的进步。

笔者将之前科研相关的推荐,以及近一年来自己的感悟进行了勘误以及修订,发表在了另一指南中,即AI自学指南,有兴趣的读者可以自行前去阅读。

科研毫无疑问是如今保研之中的重头戏,尤其是已经具备了出色的课内成绩,打算前往外校的同学,务必重视科研成果以及科研产出。

笔者希望本文的读者将科研认为是一项有趣且可以为之奋斗终生的事业,最后你们会在某一个领域深耕,并且为人类的进步向前拓宽一点点的边界,这一过程无疑是富有意义的。

保研外校

要说本篇指南相较1.0.0版本做出的最大的修订,那便是添加了保研外校的章节,这也会是一个较长的章节,帮助还未了解全貌的同学了解保研外校的全部流程以及节奏。

保研外校的本质上很大一部分是信息战,个人能力决定了保研的下限,而掌握的信息则决定了保研的上限。

计算机保研交流群(绿群)作为全国最大非商业用爱交流计算机保研交流群,一直致力于打破这种信息差,如今互联网上的大量保研相关回复与资料的背后可能均有绿群的身影,欢迎大家前往绿群主页了解更多内容。

本教程中的大量内容也存在自绿群开源信息的引用(按理来说我已经成为github organization member以及QQ群管理员,稍微偷一点应该问题不大)

保研黑话

在一切开始之前,有必要首先了解一些保研的基本黑话,这些内容通常使用较短的词汇涵盖一些保研领域中的高频信息:

  • rk: rank,般指自己的加权或绩点排名。
  • 套磁/陶瓷:提前给导师发邮件,从而获取入营资格/在导师组占坑。
  • title: 学校的牌子,如清北、华五、985、211、双非、四非、中九、末九等。
    • 双非:指的非92,但是是双一流。
    • 四非:在双非基础上还不是双一流。
  • 强com/弱com:即committee,表示学院的话语权。
    • 弱com表示学院话语权弱,导师话语权强,导师可以捞你入营。
    • 强com表示学院话语权强,导师话语权弱,导师不太能决定入营or录取。
    • 强弱com是相对的,你强它就弱,你弱它就强。
  • bar: 门槛
    • 指的是入营所需要的门槛。
    • 一般学院会以title和rk来区分。
    • 当前两者不占优势的时候,ACM牌子和论文就是一个区分点。
  • wl: waiting list,候补名单。
  • oq: over qualified,指学生报名比自身本科院校或者能力水平低很多的院校。
  • 928/929:
    • 保研系统开放当天(特别地,2023年是929)。
    • 每个人只能填写最多三个志愿,相互独立。
    • 先接受复试,再接受拟录取。。
    • 但需要在指定时间内接受,否则offer直接作废。
  • 常见的专业代码:0839(网安)、0812(计算机科学与技术)、0835(软件工程)、0854(电子信息专硕、不细分方向为085400、细分方向为计算机085404、软工085405等)。

在这里注明,西交大人工智能专业按照title划分属于中九范畴,专业代码为0854。

保研全流程

按照正常的保研流程,正常的保研一共分为以下的时间节点:

  • 极少数冬令营:如空天院等,不展开介绍。
  • 夏令营报名:一般来说夏令营的时间集中在大三下,其中如今部分夏令营报名的时间已经提前到了四月份。夏令营报名需要提交一系列的材料,包括个人成绩证明、各种获奖证明、论文证明、简历,部分学校要求如导师推荐信等内容。部分弱com学校要求导师推荐入营,需要陶瓷对方学校的老师。绿群仓库中维护着一份夏令营通知名单,对开设的夏令营及其报名截止时间进行了汇总。
  • 夏令营参营:学校根据其强弱com进行筛选,过bar的可以参加夏令营,夏令营一般实质上是笔试/机试/面试(可能包含其中若干项),并且根据其成绩排名决定优秀营员,大多数的学校开设夏令营,优营直接获得offer。
  • 夏令营结果公布:公布结果。
  • 预推免报名:一般来说在八月到九月份份进行报名,其他内容与夏令营较为相似,依然存在强弱com以及考核。
  • 预推免考核:预推免考核集中在九月份。
  • 预推免结果公布:九月份进行公布,这是基本上提前敲定的最后一批offer,包括确定wl。
  • 国家推免填报系统开放:928/929,进行预推免填报。

了解保研的全流程有助于读者彻底理解保研过程中的时间节点,这对于控制保研的节奏是十分重要的。而就像是在考研和保研之中选择了保研这种非一锤定音的,部分的读者可能也更倾向于选择保研中偏向非一锤定音的,即弱com。

大多数的弱com的考核,以及最后的名额确定,由导师全权敲定,因此提前进行陶瓷,并在组中进行科研实习是一件十分重要的事情。换句话说,实际上保研的战争在大三的上学期就已经开始,甚至这个时间要提前到大二下的暑假,在此之前,你必须积累好足够的资本,让你有能力申请外校,这些内容不应该仅包含课内成绩,同时一些科研成果或者算法竞赛获奖或许是必须的。

一个值得参考的内容是,关于清北的直博,可能在大三上或者最晚到三月份或者四月份,可能大多数名额便已经敲定了。

权衡

在保研的过程中,不难看出,实际上大多数的时候,你需要在不同的内容之间权衡。

在本校保研中,你有三年时间进行充分的准备,而且最后的评判标准只是成绩这一维的内容,而相应的,保研外校考核的内容则更加的全面,从成绩出发要求你具备足够的排名以及四六级成绩,而从课外出发,也需要你在科研中具备足够的insight,或者在算法竞赛中获得如金牌等成就,与此同时,你只有两年时间准备。

在这短暂的时间中,一系列的权衡毫无疑问是有必要的,在此之前,我或许需要为你列出在保研过程中看重的材料的比例,让本文对于后续的说明更加具有说服力。

一般来说,在保研过程中的排序为:牛逼论文>绩点>一般论文>竞赛~实习>水论文,但是需要注意的是,部分的学校在如夏令营筛选的步骤中,直接使用excel进行筛选,因此不考虑是否存在论文的问题,因此仅具备科研成果一般来说是比较困难的。

同时,作为新生,当你想要探索丰富的课余生活的时候,这种心情是可以理解的,比如说参加二次元的同好社团,但是必须提及的是,参加保研是一条艰难的道路,因此读者必须具有一定的觉悟,在这条路上有必要舍弃一些内容,假如说放在第一位的话,舍弃的应该是娱乐与休闲。

我将轻轻叹息,叙述这一切

许多许多年以后:

林子里有两条路,我——

选择了行人稀少的那一条

它改变了我的一生。

你需要的全部资料

关于夏令营的信息,关于陶瓷信的模板,关于简历的模板,关于导师的推荐,你所需要的全部资料,均可以在绿群的GitHub仓库以及QQ群中找到,其中你至少可以找到:

附录

德育分加分

德育分的加分细则可以在学生工作处的网站中找到。

智育分加分

智育分的加分细则可以在教务处的网站中找到。