窦德景:AI大模型的产业应用和DeepSeek的启示

发布日期: 2025-04-29

  正在 上说话指出,即使天生式AI手艺尚未达成大领域红利,但其正在企业内部运营、客户任事和数据明白等方面的潜力浩瀚,他日将为各行各业带来更平凡的利用场景。现将其说话整顿揭橥如下:

  →超大领域参数深度练习模子(大模子)带来的“发现”是本轮人工智能进展的厉重特色才具逐一大模子操练拉动超大领域算力需求、超大领域数据需求

  ChatGPT是首个正在环球限度内爆红的天生式人工智能(GenAI)利用。它的揭橥仅五天,就冲破了100万用户的门槛,不到两个月的时刻,用户量便激增至一个亿,创造了史书性的记录。这一功劳不只符号着人工智能手艺的奔腾,也为人工智能行业带来了亘古未有的眷注和商酌。我信赖,这种局面级进展前无前人,但确定不是后无来者的。他日,能够会有新的APP浮现,以至也许将由DeepSeek如许的新大模子手艺推出,说未必它会超出ChatGPT。

  从时刻线上看,实在“人工智能”这个词并不是由于ChatGPT或者深度练习才最先大作的。早正在1956年,达特茅斯集会上就初次提出了人工智能的观念。到了上世纪末,机械练习最先崭露头角,2010年旁边,深度练习手艺取得了迅疾地进展,而2017年Transformer架构的浮现更是掀起了一波新的海潮。到现正在,曾经过去七八年了,即使是DeepSeek如许的新大模子手艺,依旧没有齐备脱离Transformer架构的管制。我信赖,他日很疾会有新的架构浮现,以至能够是最早由DeepSeek揭橥的,这也欠好说。

  →Deepseek的浮现并没有推倒Scaling law——然而能用更少的时刻和计划资源来媲美目前最好的大模子效力

  DeepSeek的浮现是不是曾经推倒了Scaling law?咱们看到,模子的参数巨细和本能之间有必然的干系,平常来说,它们是成正比的,也是适宜Scaling law的。然而我私人以为,到了GPT-5,模子的参数能够会亲近10万亿,这个数目曾经亲近极限,不需求再大了。他日应当思考DeepSeek进展这条道,该奈何优化现有的架构,奈何用更小的本钱和更少的时刻,进一步晋升模子的本能。

  假使把参数的观念带入到人的观念当中去,那么参数不是指神经元的数目,而是指有众少神经元之间的相联。从这个角度看,人的大脑或许有100万亿个参数,但人工智能并不需求到达这个量级,由于人类大脑常用的面积只占大脑总面积的不到1/10,于是咱们只需求模仿到与人类大脑参数的异常之一就足够了。OpenAI本年估计会揭橥到达通用人工智能(AGI),我以为应当是指GPT5。GPT-5将是到达通用人工智能的厉重符号,接下来便是要思考奈何基于此实行优化和落地利用。

  天生式AI或者大模子给咱们带来了许众贸易化利用,现正在曾经产生。大模子的成绩,根本上正在各个行业中都能取得利用,好比营销、贩卖、物流、法务等,都没有题目。然而,我目前还没有看到一个齐备或许赢利的APP或利用。公共半大模子公司照样正在贴钱供给任事。然而,DeepSeek之于是这么告成,一个要紧原故是他们并不依赖大模子赢利。他们有必然的资金参加,用来组筑一个特意团队来做大模子钻探,而这个团队不需求思考古板的KPI。

  我要紧讲几个例子,都是我到场的或者引导过的项目。好比正在人力资源周围,咱们做了一个社保常识机械人,特意答复少许员工常睹的题目,好比广州的社保计谋、补缴计谋等。这个项目最初非凡容易,操纵了一个开源的60亿参数的清华智谱模子。客户当时资金有限,咱们不行流露他们的名字,这是法例。我一最先带着他们去百度商议,但百度的报价太高。最终,咱们决意操纵开源模子,进程5小时的微和谐1万次操练,告成将这个正本答复得不怎样专业的开源小模子,操练成了一个能专业答复社保计谋闭联题目的智能体系。近来,咱们北电数智也做了一个相仿的项目——北京市政务大模子。

  尚有一个闭于营业考察的利用,加倍是正在隐私号对话中的利用。比如,外卖小哥与客户对话有时会发生抵触,以至能够涉及违规、骚扰等题目。关于隐私号供给商来说,奈何尽早察觉话里的这些题目非凡厉重。与古板步骤比拟,操纵大模子后,凿凿率、召回率都大幅度升高,题目可能更早被察觉并办理。

  许众行业都正在做VOC(Voice of Customer),好比一个产物曾经推出,就需求通晓大师的响应奈何,正在社交汇集上有什么消息,那么这些消息该怎样汇集整合?正本磋商公司要紧依赖年青人来达成这一经过,现正在操纵大模子可能更高效地汇集消息、外达主见。

  其它,保障行业也正在测验应用大模子来替换少许贩卖助手的劳动。说得失望一点,他们的位子很有能够被大模子庖代。咱们测验过,大模子的成绩相当好,能节流时刻和本钱。

  我摆脱BCG之前到场了一个外企药厂的项目,这家公司正在中邦有3000众名医药代外。每当新药上市,就要培训这些医药代外跟医师互换,贩卖新药。岂论这些代外有众少履历,这个培训经过必需走。正本,这个培训需求花费一全年的时刻,况且有30个培训教师要分赴宇宙各地,或者将代外们召集到大都邑实行培训。而咱们用大模子模仿了医师与医药代外的对话,迅疾达成了培训并评估成绩。比拟正本的古板格式,这个经过连忙众了,就像诺贝尔获奖的AlphaFold,正本花费9个月时刻预测卵白质构造,现正在5分钟就能做出来相同。这不只节流了大批时刻,还明显升高了出力。

  总体来说,咱们看到,人工智能,加倍是天生式AI,昭着仍有非凡大的市集空间。DeepSeek的手艺特征和改进固然不行说是革命性的,但它确实正在许众方面有些特征,把这些特征团结起来,博得了很好的成绩。起码从本能上来说,DeepSeek和OpenAI的O1是相提并论的。区别正在于,DeepSeek正在算力上的消费以至低于其他千亿参赛级其余模子。拿千亿级的模子和百亿或者十亿级的模子比拟,实在事理不大,终于Scaling Law还是制造。千亿级的模子确定比百亿级的强,而百亿级又比十亿级的要好。OpenAI的GPT-4大约有1.8万亿个参数,而DeepSeek目前的参数目曾经到了差不众1/3了,正在邦内已知的开源模子中曾经是最大的,它最好理所该当,并不稀奇。然而DeepSeek效用晋升的同时并没有花费大批的资源,这个各个公司都正在看为什么能如许。

  其它,DeepSeek的日活动用户数(DAU)也正在连忙拉长,成为邦内操纵量最高的大模子利用,活着界限度内也独占鳌头。因为DeepSeek的进展井喷态势,它的体现最先影响到闭联家产,出格是芯片行业,一最先英伟达股价大幅下跌,现正在又涨回来。实在越是有如许一个价值比拟合理的模子,就能有越众的中小厂商插足到大模子利用这个行业内中来。跟着模子变得特别普及,市集关于算力和芯片的需求将会大大填补。因而,咱们反而特别看好算力、芯片等根源行业的他日。

  中邦邦民大学重阳金融钻探院(人大重阳)制造于2013年1月19日,是重阳投资向中邦邦民大学赠给并设立培育基金运营的要紧资助项目。

  行为中邦特征新型智库,人大重阳邀请了环球数十位前政要、银大家、著名学者为高级钻探员,旨正在眷注实际、筑言邦度、任事邦民。目前,人大重阳下设7个部分、运营治理4个中央(生态金融钻探中央、环球经管钻探中央、中佳丽文互换钻探中央、中俄人文互换钻探中央)。近年来,人大重阳正在金融进展、环球经管、大邦干系、宏观计谋等钻探周围正在邦外里均具有较高认同度。