写给自然语言处理 计算机视觉 时空数据挖掘本科新生的一封信

各位本科新生:
你们好!首先欢迎你们加入AIMLAB智能多媒体实验室! 进入实验室开展科研学习是一项辛苦但却十分有趣的事情,因为能够做出有意思的工作是一件非常有成就感的事情, 就我个人亲身经历而言,这本身就是一个挑战自己和探索世界的过程。希望你们能够在接下来在实验室享受这段充实快乐的时光。 下面我将结合我个人的学习经验,提供一些关于自然语言处理、计算机视觉以及时空数据挖掘的学习路径参考。
首先关于实验室的相关研究可以参考我的个人CV,如果有感兴趣的方向可以仔细了解,也欢迎开展新的方向。 你们可以通过吴恩达“机器学习”、“深度学习”课程来入门人工智能领域,值得注意的是, 进入这个领域需要具有一定的高等数学、概率论以及Python语言基础,了解什么是面向对象编程,这将有助你构建高效的代码。 吴恩达的课程后面会布置编程作业,可以以week为单位完成,这将非常有助你深入理解现代人工智能的基本原理。 相关的练习代码可以在Github上找到。接着你可能需要了解的深度学习框架,包括且不限于Pytorch、TensorFlow以及Keras (1. x版本系列可以帮助你快速入门)。 你需要了解的编程工具有PyCharm、Anaconda、JupyterNotebook、Spyder等。建议使用的系统macOS、Linux等, 不建议使用Windows系统完成你的项目开发。
在学科竞赛方面,计算机大类学科含金量最高的ICPC、Kaggle类比赛, 但是你的方向如果专注人工智能领域,不建议花费过多的时间在ICPC竞赛上, 从保研角度考虑,或许可以根据信息与计算机学院的推荐赛事表选择参加,不过这一切的思路来源都是源自你的科研项目推动,下面重点介绍如何开展自己的科研之路。 在论文阅读方向,我本科阶段花了两年时间研究自然语言处理方向,在保研工作结束后,花了一年左右时间研究计算机视觉是时空数据挖掘方向, 这也是我的研究生方向,因此我从这从这三个方向给出一些意见。
从论文阅读方面,深度学习领域现在比较流行的算法是LSTM、Transformer, Attention等。 而在应用领域,自然语言处理方向有对话系统、知识图谱、代码生成、命名实体识别、关键词抽取,文本分类,情感分类等。 计算机视觉领域较为流行的算法包括CNN、ResNet以及最近提出的的Vision Transformer和Swin Transformer。 时空数据挖掘领域流行的算法有CNN、GNN以及ConvLSTM等。
推荐会议:
NLP:ACL、EMNLP、NAACL
CV: CVPR、ICCV、ECCV
DM:NIPS、AAAI、CIKM、SIGKDD、SIGIR
一般而言, 同学可以先通过阅读AAAI、IJCAI上面的文章了解近期人工智能领域的主流方向和技术, 然后阅读CIKM、SIGIR、ICDM、UBICOMP 等数据挖掘相关领域的专题文章,由浅入深。 在具有一定基础后,可以阅读KDD、www等更为顶级的会议。人工智能领域, 可以阅读NIPS、ICML等顶级会议。 事实上,我们方向比较主要的阅读文献来源就是AAAI、IJCAI、CIKM、KDD、WWW、SIGIR、IEEE TKDE等。
此外,还要学会刷会议,以上会议可以经常在dblp(主流论文检索)里进行检索,并对一整年该会议的论文进行整理,顺序是这样: 先看标题,选择感兴趣的阅读摘要,再阅读模型图和introduction, 最后阅读全文。此外, 还要勤做笔记,记录好的idea和表达好的句子、公式。
阅读论文的顺序如下:
标题=>摘要=>模型图=> introduction=>方法⟨Methods)=实验,具体在任何一步如果你觉得不感兴趣或者和自己的研究相关度不高,都可以放弃,但是你需要保证每周1篇左右完整论文的阅读量。 我们也会推荐一些有价值或者有意思的论文,发到群里,你们可以选择性阅读。
好了,就写到这儿,欢迎大家在科研学习的过程中与我交流,如果合适可以推荐到中国科学技术大学先进技术研究院\火灾科学国家重点实验室\人工智能研究院进行科研实习。 祝大家科研学习顺利,收获自己想要的。

Get in Touch