我的“七年之痒”-变与不变:从LSTM到RAG、大模型
蓦然回首,从 18 年开始接触 NLP(自然语言处理)开始,已经 7 年有余。机缘巧合的情形下,让自己和NLP 有了第一次邂逅。
从未接触NLP 相关研究的自己,凭着年轻的热血投递搜狗的实习,那时候“不计后果”,不去考虑是否能行,直接“打火车”从天津到了北京,迎来人生的第一次(实习)面试。
犹记得面试官的一个问题,“武汉市长江大桥”有几种分词方式,这个 NLP 中最典型的问题打开了我的 NLP 之路,实习的面试不难,当天面完当天又急匆匆的从北京赶回了天津,那时候好像有这用不完的精力,对未来也充满了乐观的预期。面试结果是在返程的高铁收到的:通过。就这样,和 NLP 结下不解之缘。
随后的岁月里,一直在 NLP 领域,做过算法研究,也做过算法落地。感觉 NLP 是一个很神奇的技术,能够把我们人的语言,通过某种方式,让只有计算机听懂,并以人的语言表达出来。
都说程序员是有时效的,从业 7 年来,回首过去,见证了NLP 技术的“更新换代”:从最初的机器学习时代(统计机器学习)、深度学习时代、预训练+微调时代以及当前的大模型时代,技术的发展是迅速的,不似传统行业,例如医生。经验的重要性,在日新月异的互联网行业显得“可有可无”。
自己感觉无比幸运的是,从事的行业始终是自己喜欢的、热爱的,愿意为之付出时间、精力去研究、去实践。相比之下,这点上,带给了自己非常多的幸福感,让枯燥、乏味的生活中多了一点为之期待的事,犹如沙漠中遥远的绿洲,留有期待。技术有着独特的魅力,深深的吸引着我。尤其是技术的突破和落地,那种兴奋让人欲罢不能。
22 年下半年,文生图技术的成熟,大量的 APP、公司犹如雨后春笋一般纷纷出现,犹记得第一次体验一格(百度文生图),画的是一张墙后偷偷观察的小猫,当结果呈现出来后,被效果深深的震惊了,震撼技术的发展,文生图背后的技术犹如毒品一般,产生了深深的吸引和好奇:扩散模型、提示工程、能量模型、……
在浩如烟海的各种论文、博客、网站游荡,希望了解更多文生图的细节时候,OpenAI 的“核弹”:ChatGPT 问世了,体验了 ChatGPT 后,感觉自己像个“渣男”,立马投入“新欢”-ChatGPT 的怀抱,从此开始了大模型的追逐之路。
随着大模型的问世,之前小作坊一般的NLP解决范式被颠覆,大力飞转仿佛成了所有人的共识,好似随着模型的无限增大,AGI(通用人工智能,也叫强人工智能)触手可及,国内的百度文心一言、阿里通义千问、华为盘古、智谱清言、百川智能、月之暗面;国外的谷歌 Gemini、Anthropic的Claude、OpenAI 的ChatGPT等大量的独角兽或者传统巨头入局大模型。
爆火的大模型,创造了一个职业:提示工程师——一种专门负责如何向大模型提问和沟通的工种(配图:对比),20k-50k 的高薪让大模型的火烧的更加旺,让人意识到:提问也是一个技术活。从 2023 年上半年开始,国内“百模大战”的战火持续了一年多。随着大模型自身能力的提升,提示工程的重要性略有下降。但随之而来的是各种落地应用的探索。
本文转载自 芝士AI吃鱼,作者: 芝士AI吃鱼