一、前述

2020是不平凡的一年。展望2021,希望大家都能有所收获。在此谈下算法方面的工作。

二、工作类别

目前算法工作的话,第一类是数据挖掘,它包含的知识,跟机器学习相关度会更大,包含常规的数据挖掘以及推荐算法。在数据挖掘里面,要单独的会机器学习的特征工程,和其它的领域的知识,比方金融公司,可能要知道一些金融公司业务方面的知识。

数据挖掘,可能有几个附加的知识也需要知道,有的数据挖掘岗,它需要一些机器学习和大数据的组合,还有一种是机器学习的知识,加上自然语言处理的这方面。 新浪微博的数据挖掘岗,可能也需要你会一些自然语言处理方面的东西。

两种组合,一种是传统的数据挖掘和自然语言处理组合打包,是比较抢手的,因为相当于是两个方面的。另外一个就是数据挖掘和大数据方面的组合的叫大数据挖掘。还有一些数据挖掘方面的,推荐系统,它也是属于这个种类的。

第二类就是图像视觉方面,目前最热的是人脸识别,还有就是目标检测、目标追踪。

刚才说的这些,流行的做法是用深度学习来做。如果是做图像视觉的话,一定要看图像视觉方面的书,你比方说 数字图像处理,模式识别,这两本书得看一下,额外具备的知识。

第三类是自然语言处理,第一个是用深度学习做自然语言处理,目前最难的就是聊天机器人,还有用深度学习做实体识别的,语意相似度计算。

如果想在自然语言处理这方面很多工作都得心应手的话,你要加强自己的附加东西,比方说要会实体识别,会算法分析。

自然语言处理的岗位,第一个要求你会意图识别,第二个是语义分析,第三个是智能智能问答,第四个是智能客服。

上面是工作涉及比较多的。还有机器翻译,相对少一些,这些是工作的方向。

三、总结

一个是图像视觉,一个是自然语言处理,一个是数据挖掘,你要尽快的想好去哪个领域,跟你的兴趣爱好是有很大帮助的。

还有几个比较偏一点的,语音识别是2017年的薪资最高的,应届生的话,硕士以上的学历,出来就是27K到30K,这个是boss直聘上统计出来的。2017年它是最火的,2018年它也不会少多少,有一个领域知识,肯定比泛泛的只会机器学习、会深度学习,没有领域强项的要有竞争力。

所以要尽快的不断地要把机器学习、深度学习要学好,尽快的把你的领域方向定下来,然后把这个领域上面欠缺的东西,用业余时间把它加强,把它做完整。

语音识别、语音合成,可能需要掌握的知识就是数字信号处理,还有信号与系统这两个东西。

当然还有一个领域考研招的人更少,那就是智能机器人以及无人驾驶,无人驾驶汽车、无人驾驶飞机,它涉及到的算法是强化学习,后两个不建议去找,一开始就找后面两个的话,难度会很大,并不是说它的知识比别人难,最主要是这个岗位要少一些,意味着机会就少。

我建议是前面三个,数据挖掘岗,自然语言处理岗,图像视觉岗。

四、具体入门工具

数据挖掘岗在我们的学习体系里面,主要涉及机器学习方面东西要多一些,尤其是特征工程, 80%的时间在公司里面,在做特征工程的一些东西。

图像视觉需要的知识,主要是深度学习,现在基本上就不太会用传统的机器学习或其它别的算法。

自然语言处理,一半对一半,深度学习来处理自然语言处理占了一部分,它是最先进也最难的。还有一部分是基于传统的规则的基于语法分析,然后做自然语言处理方面的东西,占了很大一部分。

若做图像视觉用到的工具是OpenCV可能要比较掌握的熟练,其次就是tensorflow,在tensorflow掌握得很好的情况下,可以再考虑用caffe,如果tensorflow还掌握的不熟练,建议使用tensorflow,它有这种趋势,把其它别的深度学习框架全部覆盖掉,以及目前应用较多的pytorch

自然语言处理领域,jieba主要是用来做分词的,第二是nltk能做分词,还能做词性标注,还能做实体识别以及语义分析,句子结构分析。

目前跟传统的自然语言处理以及深度学习半结合的叫做gensim。这个是过渡阶段的,既有传统的又有深度学习的。还有一个就是tensorflow最难的,倾向于机器学习叫做spark mlib,最大的不同是它用集群做的。

这些掌握了,基本上工具方面就全部包含了。

五、算法入门系列课程

可以帮助你快速入门基础算法。15节大白话算法 ,后续会持续更新。以通俗生动的方式讲解人工智能前沿算法。愿景是打造全网AI最通俗教学,赠人玫瑰,手有余香,在人工智能前行的路上一起前行,以通俗简洁详细的方式,让每一位热爱着深入其中。空间有形、梦想无限!加油!