AI大模型：声势喧天，悄悄落地

2023-05-08 来源：搜狐原文链接评论0条

今天，随便拉个人出来都会说两句AI。我们关心它的能力，看它的乐子，也担心它的提升。没有人会拒绝从天而降的热度，早期投资人早已闻风而动，二级市场不愿错过这一轮上升的机会。不论估值还是市值，反映的都是我们对技术的乐观预期。

在AI的世界里，人类已经乐观了好几次。

2016年，AlphaGo打败李世乭，AI概念便开始走红；2018年，波士顿动力展示了跑酷王Atlas 2的演示视频，虽然它和AI并无关系，但也再次让相关概念股不断异动。每当AI有最新进展，随之而来的都是大量概念炒作，但AI行业不仅有很高门槛，还有很高的天花板。

最近一段时期，ChatGPT概念股，又一次复现了上述情境，一些企业有意捧之炒之，2023年2月1日~4月7日，相关概念累计上涨达62.38%，而在此后ChatGPT概念股遭最狠下跌。[1]

我们常用Gartner曲线去描述一项技术的成熟度，但须知Gartner曲线原名“Hype Cycle”——是伴随技术发展的炒作的周期。

这是再朴素不过的道理：炒作结束，应用才真正起飞。

饼好画，事难成

事实上，OpenAI成功并非追随概念热点，其核心领导团队是一群富有使命感的技术偏执狂，坚定拥抱通用人工智能（AGI），并持续推动大模型相关技术。[2]

许多人都没有想到，大模型竟然可以取得如此成效，国内企业也顺势纷纷赶工，但做大模型，谈何容易。

中国信通院《人工智能白皮书（2022年）》指出，人工智能正朝更大规模、更多模态的方向发展[3]。未来的大模型，不仅需要算力惊人，更会通晓文字、图像或视频。

首先，高质量语料正逐渐消耗殆尽，更多信息需要从视觉上获取，也就是向多模态发展。人类一生可以听到约10亿个单词，GPT-3就已学习约5000亿语言数据，已知最大语言模型数据消耗量在2万亿个Token（指文本中最小单位）以上，而人类文明产生高质量语料共9万亿左右，语料被用完是迟早之事。事实上，人类是视觉动物，80%信息通过眼睛获取，且神经元处理视觉和语言连接数比例为10：1，因此让AI也学会识图，就能更快了解世界。

其次，大模型时代单纯使用参数量的标定方式已过时，现在应该综合考虑算法、数据和算力三要素。过去10年，最好的AI算法对于算力需求增长超过了100万倍，也就是每两年提高一个数量级。随着多模态的引入，数据量将继续指数级增长，当计算量有限情况下，需要分配更多计算资源给数据，而不是完全给参数，用公式来说，就是“大模型参数量×处理的数据量=计算量”，计算量越大，通用能力越强。

神经网络参数量算力需求增长已超过100万倍

国内外成型的类ChatGPT产品，其本质均由前期大模型而来，而产品本身能力则主要取决于前期大模型发展情况[4]。自从AI大模型于2017年被提出，国外就已经开始进行相关超大规模训练，并于2021年正式进入军备竞赛阶段。[5]

国内在早期拥有大模型能力的公司是少数。且国内大模型仍缺乏数据量，也做不到高层级的架构[6]。更困难的是，大模型是算力巨兽，依赖高端GPU芯片，一个大模型需数万块GPU，以此推算，是至少几十亿元人民币的投入。[7]

虽然困难重重，但也有满足做大模型一切条件的公司，这种公司需要既有算法，又有算力。

让大模型有用

从“大炼模型”到“炼大模型”，AI产业前期投入大而后期应用难一直被行业所诟病。而如今，将语言、视觉等信息和能力融为一体的多模态大模型正悄然引发AI设计范式的转变，即从专用人工智能走向通用人工智能（AGI）。

目前普通用户和产业界也在追求多模态AI工具的联合应用。一个模型被用于指挥另外一组模型、被用于生成Prompt。应用层面的创新层出不穷，是新一代大模型+场景的结合。

但“AI+场景”真的很贵，研发周期也极长，每个场景均有其专属模型，如果遇到新任务，就要重新设计AI系统，采集样本，对模型重新训练。而AGI就像一个可以适配各行各业的万能钥匙，当大模型厂商把推理能力部署到千行百业，就能让更多应用享受到AI带来福利。[8]

3月中旬以来，大模型混战开打，百度、阿里巴巴、华为、360等公司分别展示了其在大模型领域的进展。而国内也一致指向新概念——模型即服务（Model-as-a-Service，MaaS），描绘一副全新的商业前景。

为了扩大市场应用，大模型应瞄准ToB业务。我们也看到，国产大模型也正一点点地撬动B端更多应用。

作为从2018年就开始研发大模型的AI公司商汤科技，就在近日展示了其日日新SenseNova大模型体系，面向行业提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务（MaaS）。

3月以来，越来越多的人机对话应用浮出水面，各家公司都对其拥有自己的思考。日日新大模型体系下的千亿级参数语言大模型“商量SenseChat”作为聊天助手，可以解决复杂问题、提供定制化建议、辅助创作成本，同时还能在医疗领域提供导诊、健康咨询、辅助决策等对话能力，在编程领域提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

商汤基于日日新SenseNova大模型体系，自研包括如影SenseAvatar、琼宇SenseSpace、格物SenseThings以及文生图大模型秒画SenseMirage（同时也支持大量第三方丰富开源模型导入）等一系列生成式AI模型及应用，既可以生成高清图片和视频，也能生成各种3D内容。

多年发展中，自动驾驶很难向更高级别跨越，而它也很难像人一样，可以灵活应对各种路况，多模态大模型或许能够解决这种困境。利用大模型生成大量困难样本，再用环视感知数据和多模态数据作为输入，实现感知和决策一体化，通过环境解码器重建3D场景，实现路径规划，并用自然语言解释自动驾驶动机，就能使自动驾驶系统更安全可靠，且具有可解释性。商汤则开发了自动驾驶的BEV（Bird Eye View）感知算法，实现量产，并在今年开发能够实现端到端自动驾驶的UniAD，比SOTA更准确，误差更低。

商汤的自动驾驶大模型概况

传统AI技术下，人工标注所需时间长、成本高，需投入大量资源。而利用大模型可以实现自动标注，大大降低了成本。商汤明眸自动化数据标注平台则提供自动数据标注服务，它拥有12个行业级大模型，涵盖超过1000个目标类别，且能标注2D和3D。当用户上传图片数据，就可以对目标进行检测和属性识别，并自动显示标注。

商汤明眸SenseAnnotation概况

生物医药领域，人类基因组携带了超2万个蛋白质的指令，但人体20种不同氨基酸通过排列组合，再经过螺旋和折叠，形成不同的复杂结构，只有约1/3蛋白质的三维结构通过实验方法得到了解析[9]。因此解析蛋白质结构是一项非常重要的基础工作。

蛋白质功能通常由其结构所决定，要预测其结构，算力资源是基础。DeepMind的Alpha Fold之所以名震人工智能界与科研界，就在于其学习了X射线晶体学和冷冻电镜的实验数据，使其预测蛋白质结构能力超群，大大提升科研效率。商汤AI大装置为蛋白质结构大模型提供AI推理算力，并为蛋白质相互作用模型，提供研发平台及训练算力，在与百英科技合作中，蛋白质结构预测大模型推理时间可由数小时减少到数分钟，使得蛋白质结构预测性能达到工业应用的标准，抗体筛选效率提升60%。

不同于其它厂商大模型技术路径，商汤是以视觉大模型为核心技术突破点衍生而来的多模态大模型发展路径：2019年商汤即研发了10亿参数视觉大模型，至2022年已推出320亿参数视觉大模型。与此同时，商汤也提前布局自研NLP模型和多模态模型，并在2021年就应用在商汤数字人等产品中，在今年 3月，商汤还开源了30亿参数的多模态大模型书生2.5。

基于AI领域的长期应用落地，商汤积累了大量的、有人反馈的、视觉类信息,形成优质多模态语料，也使得桎梏大模型发展的数据难题迎刃而解。

此外，商汤AI大装置SenseCore也奠定了商汤的发展基底。它目前的算力规模包含2.7万块GPU，可输出5000PetaFlop的算力，支持20个千亿参数超大模型同时训练，支持最大4000卡并行单任务训练，可持续7天以上不间断稳定训练。

对于正探索多模态大模型的公司，到底如何让大模型更有价值？商汤构建能力的思考，也许有些参考意义：一是优化好模型本身，提高多模态数据处理能力，让文字、图片、视频无缝衔接；二是提供更多高质量数据，给模型更多“好口粮”；三是与生态伙伴探索商业应用，让大模型释放更多生产力，如智能助手、自动驾驶、医疗诊断；四是让大模型时刻安全可靠。

写在最后

美国斯坦福大学人类中心人工智能研究所（HAI）发布的《人工智能指数报告 2023》（AI Index Report 2023）显示，大语言模型论文发表量方面，美国要远超其它国家。[10]

图源：美国斯坦福大学[10]，汉化丨公众号“科研圈”[11]

在投入上，美国也远超中国：2022年，美国在AI领域的私人投资为470亿美元，约是排名第二的中国（130亿美元）的3.5倍。

图源：美国斯坦福大学[10]，汉化丨公众号“科研圈”[11]

大模型作为前期投入极大的技术，需要的并不是概念，而是在提高投入的前提下，找到更多看得见摸得着的商业化应用。当大模型被每个人触及之时，行业便会被更多人所重视。

References：

[1] 深圳商报：ChatGPT概念暴跌，机构、游资却在抄底！最强主线真的熄火了吗？.2023.4.10.https://mp.weixin.qq.com/s/TkXbhHu5jODPXWPQzEj5ig

[2] 新智元：张宏江：大模型发展机会与挑战.2023.3.18.https://mp.weixin.qq.com/s/pjUaRD0YV2qb6MXZ-oVstQ

[3] 中国信通院：http://www.caict.ac.cn/kxyj/qwfb/bps/202204/P020220412613255124271.pdf

[4] 智能相对论：ChatGPT冷观察：没有大模型的土壤，开不出ChatBot的花.2023.2.16.https://mp.weixin.qq.com/s/f7HTfM0wlh5D1GFJcJVstw

[5] 祝梅.国产AI大模型，寻找未来竞争力[N].浙江日报,2023-04-12(003)

[6] 新眸：阿里大模型也来了！聊聊我的几点看法.2023.4.9.https://mp.weixin.qq.com/s/RZ73F7Z231H5GPg6s0p3LA

[7] 许林艳.国产AI大模型“百舸争流” 夯实算力底座正在进行时[N].证券日报,2023-04-12(A03)）

[8] 张依依.大模型正在塑造人工智能产业新格局[N].中国电子报,2023-04-11(007)）

[9] Callaway E. DeepMind’s AI predicts structures for a vast trove of proteins[J]. Nature, 2021, 595(7869): 635-635..https://doi.org/10.1038/d41586-021-02025-4

[10] THE AI INDEX REPORT：Measuring trends in Artificial Intelligence.https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index-Report_2023.pdf

[11] 科研圈：https://mp.weixin.qq.com/s/yfOQkyWoManWRUlnSAWEeA

关键词：模型 AI 商汤模态算力 10

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络content@sydneytoday.com。