以 ChatGPT 为代表的大模型再一次带火了人工智能。
基于目标人群、用途和适用场景的不同,大模型市场可分为通用大模型和垂直大模型两大类。
(资料图)
通用大模型,聚焦基础层,以技术攻关为目的。他们对标 ChatGPT 做通用大模型,百度的文心一言,阿里的通义千问、科大讯飞的星火大模型等都归属这一类。
垂直大模型,聚焦解决垂直领域问题,以产品开发为目的。他们在通用大模型基础上训练行业专用模型,应用到金融、医疗、教育、养老、交通等垂直行业。
通用大模型的长处聚焦于一个 " 广 " 字,面向人群以及场景适用范围十分广泛。
但对于特定场景而言,企业并不需要通用大模型的 " 全能 " 能力,更多需要的是模型的精度和质量。
垂直大模型以此为切入点,选择了另一条路径。他们以具备的行业知识为基础,通过与通用大模型企业合作的方式,训练行业专用模型。
" 站在客户角度,行业客户最为看重的是定制化的需求,以及 AI 企业的工程化落地能力。" 众数信科 CEO 吴炳坤对雷峰网说。
作为垂直大模型的一员,众数信科成立于 2021 年初,由云从科技、厦门火炬创投、民生电商发起成立。
众数信科定位 AIGC 领域的 " 知识智能化 ",即将数字城市领域沉淀的行业数据、专家经验,通过 AI 技术进行工程化。
简单理解,众数信科只做一件事,即将 AI 大模型微调为行业专用模型,帮助行业提升效率。
在吴炳坤看来,做行业的垂直大模型,同样存在巨大的商业价值。
通用大模型门槛高企,初创公司在垂直大模型寻找机会
过去几年,商业化一直是困扰整个人工智能行业的难题,大模型的出现让 AI 商业化看到了新机会。
吴炳坤将 AI 比作工业时代的石油钻机:" 没有钻井机,石油就无法成为工业时代的黑色血液;数据要素时代,没有 AI,数据的价值也就得不到充分挖掘。现在大模型带来了无限的想象和发展机会。"
两年前,在数字城市领域,AI 更多基于小模型,比如算法只做人脸识别,或只做车牌识别,产品受限很大,研发成本很高,可以扩展的空间不多。
现在,随着 AI 大模型这一关键技术的突破,数据和 AI 的结合度更加紧密,上述问题都得以突破。
大模型将对全行业都产生颠覆性地重构,已经是业界共识。百度李彦宏、阿里张勇等不少业界大佬都在不同场合,不断重复同样一句话:AI 大模型时代,每个行业的应用都值得重新做一遍。
从目前国内扎堆发布的大模型来看,基础大模型的技术创新,更多是大公司的角斗场。
阿里巴巴张勇曾指出,超万亿参数的大模型研发是一场 "AI+ 云计算 " 的全方位竞争,囊括了算法、底层庞大算力、网络、大数据、机器学习等诸多领域,是一项复杂的系统性工程。
一方面,通用大模型需要大量有效的数据与计算资源,这离不开超大规模的 AI 基础设施的支撑;另一方面,长时间的训练、推理背后,也往往意味着高昂的成本。
正因此,当下大模型市场的主角大都是来自于移动互联网时代的大巨头,如百度 " 文心一言 "、阿里 " 通义千问 "、腾讯 " 混元 " 等。
大公司们瞄准广泛适用的人群,齐齐布局 NLP、CV、跨模态等多种模型,动用同样海量的数据参数进行预训练,动作整齐划一。
这种 " 你有,我也有 " 既是实力的展现,同时也存在同质化问题,会逐渐消弭彼此之间的辨识度,难以在市场中发挥优势。
并且,大模型 " 海纳百川 " 的魅力纵然令人着迷,但其终归是一项技术,技术只有与具体应用结合变成产品,带来实际的使用体验和转化成效,才真正具有价值。
换句话说,通用大模型的 " 大 " 和 " 通用 " 看着诱人,但对于 B 端行业客户来说,并不能满足需求。
行业客户使用大模型的最终目的,是让业务发展走上新的台阶。因而,他们需要的不是综合技术上的碾压,而是能在具体需求上追求极致,可以实现功能最大化的产品。
换言之,行业客户愿意为合理开发利用的功能买单,但不会为自己用不到的功能买单。
在此背景下,中小初创型企业们,看到了机会。
他们受限于资金和技术,难以走上通用大模型的角斗场,但由于本身具备一定的行业领域知识,反而在垂直大模型的探索上具备天然优势。
在人工智能时代的浪潮中,聚焦少数细分赛道,在通用大模型的底座能力之上,围绕 " 如何用好大模型 " 这一接地气的主题,已经成为小公司们安身立命的根本。
专用大模型必经的三重淬炼:技术、场景、数据
当下,很多主流的 AI 大模型,并没有对外开放模型的训练和微调。较为普遍的做法是,将模型开发好以后,给用户提供一个接口调用。
在吴炳坤看来 " 很多 AI 大厂现在不会将大模型微调为行业专用模型的能力开放出来。"
首先,AI 大模型的打造是一个从算力,到整个框架,到模型再到应用的递进过程,当下 AI 大厂更多处在夯实基础能力的阶段。
其次,AI 产品进入行业,需要跟外部行业应用做适配协同,目前国内的 AI 大模型做得还不够成熟,当下这个时间点,AI 大厂还不太具备工程化落地的能力。
这一现实背景下,垂直大模型玩家要想在通用大模型的基础上微调和推理,定制行业专用模型,并非易事。
基于和云从科技的关系,众数信科不仅能够参与进云从大模型的开发过程,还可以在云从大模型的基础上训练和微调自有的专业模型。
" 通过云从,众数信科可以获得更加便捷的接口,更加开放的合作架构,定制化的衔接服务。现在市场上除了 AI 大厂,其他公司不具备这个能力,这是现阶段众数信科有别于其他创业公司的优势。" 吴炳坤说。
在吴炳坤看来,大模型在业务落地过程中,需要不断强化三个方面的要素:一是人工智能技术研发,二是可触达用户的行业场景,三是高质量的行业数据语料。
在技术和场景两个要素上,众数信科的三家股东优势互补,形成了一个较为完整的闭环。
底层技术方面,有云从科技的算法、算力做背书;在应用场景上,有厦门火炬创投提供的制造业产业数字化实践基地;在落地过程中,则有民生电商提供金融和产品商业化落地的资源支持。
三个要素中,最难的是行业数据的获取。因为行业数据会直接影响技术迭代速度和商业竞争。
根据数据的变化性,行业数据可以分为静态数据和动态数据。
静态数据相对稳定,不会发生即时变化,获取路径较为清晰,比如广泛存在于各级政府部门、国企、企业中的自有文档,以及数据库中的数据等。
动态数据指不同行业场景中每时每刻产生的数据,这部分数据不断更新、变化,不容易获得,是与其他竞争者拉开距离的关键能力。
对动态数据的实时获取是众数信科的核心优势之一。
过去两年,众数信科以 "i 城市生活服务平台 " 为媒介,触及了国内 6 个省 16 个城市的 3000 万个人用户和数十万企业用户,积累了大量数据。
通过 i 城市服务平台,众数信科积累了丰富的场景数据,G/B/C 端用户需求和行业 know-how,依托主流大模型技术底层能力,为客户提供专业领域的知识智能工程化产品和 KAAS 服务。
此外,由于当下通用大语言模型在专业领域里可训练的语料较为缺乏,因此语言模型落地细分领域过程中,知识局限、认知偏见、记忆幻觉等问题时有发生。
其中,知识局限、认知偏见问题,可以随着数据的不断积累、量变,得到解决,更大的难点来自于记忆幻觉。
本质原因在于,语言模型并非传统理解中的一个数据库,没有真正的记忆能力,无法记住过去处理过的信息。而是通过训练数据学习文本序列的数据分布,然后再根据学习到的数据分布生成文本序列,最终生成内容。
吴炳坤表示," 大模型并非一蹴而就,而是一个不断动态优化的过程。众数信科会根据特定行业场景,以及对知识库上下文的学习等特定方法,在较大程度上规避生成内容‘胡编乱造’的情况,同时不断和客户做基于人类反馈的强化学习。"
行业专用模型的商业化落地,一场从 B 到 C 的竞速
对比通用大模型,行业大模型需要更快的商业化来兜底。
"AI 大模型在行业落地的赛马,谁跑得越快,谁越有机会。" 吴炳坤如此总结。
众数信科的商业化思路是:G 端搭平台,B 端积累经验,C 端快速复制。
通过 G 端切入,能够快速覆盖市场,同时批量聚拢 B 端和 C 端资源,最终将 B 端行业客户经验,快速复制到 C 端。
" 只有 C 端才能形成快速复制的病毒效应,C 端是现在以及下一个阶段重点布局的领域。"
城市生活服务领域,教育、养老和文旅,是众数信科找到的三大落地场景。
以教育行业为例,众数信科依托云从的从容大模型,首先打造出了适用于学校、培训机构的教育行业专用模型,并已在厦门部分地区试点使用。
具体落地过程,主要分三步进行:
第一步,积累和标注。基于多年在数字平台建设和运营中积累的教师行业专业语料数据,同时依托行业专家经验对数据进行标注,形成专有领域的训练数据。
第二步,训练和微调。在前者的基础上,依托云从的从容大模型,采用知识蒸馏、权值量化、剪枝等工程化手段,将通用、庞大的教师网络,训练成一个特定行业的学生网络。
第三步,落地和反馈。进入具体场景,并在此后运营过程中,不断积累用户的正负反馈,通过基于人类反馈的强化学习,反向打磨教育行业模型。
上述三个步骤中,专家的数据标注,以及基于人类反馈的强化学习,是两个必经的难点。解决这两个难点,需要通过推广行业应用,加强知识积累,不断自我迭代逐步解决。
与模型专业性的逐步进步相对应,众数信科选择了从教师的 " 数字助理 " 到 " 数字分身 " 的渐进路线。
现阶段,众数信科的行业专用模型还处在教师的 " 数字助理 " 阶段。" 数字助理 " 具备课件自动生成、灵活生成考题、对学生进行个性化评价等服务,教师在生成内容的基础上做最后的审核把关即可。
一方面," 数字助理 " 通过辅助教学的方式,可以大大解放教师的精力,不断提升教学效率;另一方面,在与教师共同工作过程中也可以不断学习,最终成长为优秀教师的 " 数字分身 ",达到接近一位优秀教师的程度。
目前,我国教育资源供给侧明显不足,先进地区和落后地区的教育资源差距较大。打造教育行业模型的意义在于,可以借助 AI,将先进地区的先进学校的先进教师经验传承下来,带到部分教育资源供给不足的地区。
众数信科采取了两条腿走路的办法,即分别在教育先进地区和教育落后地区推广 " 数字助理 " 和 " 数字分身 "。
" 将先进地区教师知识的沉淀,放在同样先进的地区,可能不能满足需求,但在一些教育落后地区,基本上能够符合当地的使用需求。"
换言之,发达地区沉淀的 " 数字助理 ",在部分教育资源稀缺地区,已经相当于教师的 " 数字分身 "。
吴炳坤向雷峰网透露,今年下半年,众数信科将在黑龙江教育资源比较欠缺的地区,进行 " 数字分身 " 的布局。
未来,随着教育行业的模型沉淀和知识积累,因人施教也是教育模型功能演化的重要方向。" 数字分身 " 可以进一步走入家庭,根据不同学生提供差异化教育方案,做到因人施教,为家庭教育减负。
结语
当下,无论通用大模型玩家,还是垂直大模型玩家,都在全力奔跑,尚未形成独大格局。
但据吴炳坤判断," 对于 AI 大模型,如果推出爆款产品,大概率会形成通吃的局面。"
对众数信科等中小初创企业来说,两个明显的压力摆在眼前:
一方面,行业的快速发展,催促着企业要迅速产生爆款产品,同时形成快速迭代的能力。这对企业的人才储备、产品和技术路线、战略决断能力、资金储备等都提出了更高的要求。
另一方面,随着来自不同背景的玩家相继入局,竞争格局也将随之变化,比如教育领域,科大讯飞、猿辅导等都已悉数入场。
AI 大模型在行业落地的赛马,势必是一场争分夺秒的竞争。
标签:
-
重点聚焦!大模型做通用 Or 垂直?中小 AI 公司的「生死抉择」
以ChatGPT为代表的大模型再一次带火了人工智能。基于目标人群、用途和
-
高校停用微信支付,微信发声明解释称:承担通道成本已达 10 亿
6月29日消息,针对多家高校停用微信支付一事,微信团队发布声明称:“
-
郑新立:城市更新是扩大内需最有潜力的突破口
北京日报客户端|作者郑新立中国国际经济交流中心资深咨询专家郑新立在
-
表格相乘公式怎么弄_表格相乘公式-世界播报
1、操作设备:戴尔电脑操作系统:win10操作软件:EXCEL表2017首先打开E
-
天天热消息:屏幕保护程序作用_屏幕保护色
1、首先在桌面空白处右键点击打开菜单,选择“个性化”;2、进入“个性
-
第四届“非洲咖啡”冠军咖啡师挑战赛在长沙举办-世界快消息
中国日报6月30日长沙讯6月30日,第四届“非洲咖啡”冠军咖啡师挑战赛在
-
丰田和现代汽车电动车广告被指误导消费者 广告标准局予以禁止
【ITBEAR科技资讯】6月29日消息,据报道,英国广告标准局(ASA)近日对丰
-
宁波东力:风电齿轮箱业务目前占比很小
有投资者在投资者互动平台提问:请问贵公司有哪些减速电机,风电业务减
-
TCL李东生:中国制造将转向高附加值,发展可解决减员问题 全球观速讯
企业家精神、创新精神是当前驱动世界经济增长的重要动力。6月27至29日
-
长春市朝阳区举行“文艺志愿者”授旗仪式
30日上午,长春市朝阳区“文艺志愿者”授旗仪式暨文艺志愿者业务辅导阶
-
全球热文:白板上的油性记号笔怎么擦掉时间长_白板上的油性记号笔怎么擦掉
1、最直接的方法就是用白板笔把马克笔上的字迹描一遍,然后用纸或布把
-
doremi歌词连读方法_doremi歌词 今日最新
1、DoReMi是美国著名音乐剧《音乐之声》的插曲Doe,adeer,afemaledeer Ray,
-
天天速讯:温网即将开赛,7位中国选手进入正赛,3位获种子资格
阿尔卡拉斯打破了四巨头对温网头号种子长达20年的垄断,上一次有BIG4之
-
微软VS Code更新:增加“Call Hierarchy”功能
近日,微软成功更新了其VSCodeC++扩充套件至1 16版本,其中增加了一个
-
焦点短讯!剑与勇士修改器(剑与勇士修改器)
软件大小:85KB软件语言:简体中文软件类别:游戏视频 免费软件 游戏工
-
全球新消息丨集合啦动物森友会布置家具有什么技巧
《集合啦!动物森友会》中想要让自己的别墅小屋变得更加有内容更加丰富
-
环球热讯:江苏省泰兴市发布雷暴大风黄色预警
泰兴市气象台2023年06月29日14时03分发布雷暴大风黄色预警信号:预计今
-
短线高手涨停绝招视频_短线高手涨停绝招公式
1、Var1:=(CLOSE*2+HIGH+LOW) 4;SK:EMA(Var1,13)-EMA(Var1,21);SD
-
麻椒油怎么炸才好吃_万能正宗麻椒油配方
品天下美食大课堂麻椒油制作教程食材准备:干麻椒50g、菜籽油200g、大
-
警察观察人厉害吗_家子说法:男子围观警察办自己的案子被抓|全球热门
“按摩店卖淫嫖娼案现场指认点,请勿靠近”,一个大牌子放在椅子上,面
-
高达:时隔43年后官方重现吃番茄剧情阿姆罗:水星人这么保守吗 当前速递
不得不说高达系列新作水星的魔女这部动画真的很有意思,仅仅是第一话的
-
环球讯息:同事选小米13,iPhone14?
iPhone14作为标准版机型,按照配置和价格来看属于高端机型,小米13也是
-
国内十大女包品牌2019_国内十大女包品牌排行_焦点热讯
1、爱马仕是世界著名的奢侈品牌,由蒂埃里爱马仕于1837年在法国巴黎创
-
深交所向大亚圣象发出问询函-全球热头条
2023年6月30日,深交所向大亚圣象(SZ000910,最新价:7 79元)发出问
-
医疗保健设备港股走高,微创机器人涨超13%|今日观点
6月30日电,医疗保健设备港股走高,微创机器人(02252 HK)涨超13%,启明
-
台州1号海上风电场配套项目投运! 世界速看料
日前,浙江台州1号海上风电场的重要配套项目:220千伏珊瑚变电站工程启
-
快看:smart汽车澄清:奔驰与吉利没有退出股东行列
smart品牌全球公司于6月28日晚间发布声明称,关注到网络流传“奔驰和吉
-
二苯基二氯硅烷商品报价动态(2023-06-29)_全球最新
交易商品牌 产地交货地最新报价二苯基二氯硅烷 含量≥99,230kg桶装淄
-
僧帽水母生活在什么水域(僧帽水母的分布范围)_环球今头条
来为大家解答以下的问题,帽水母生活在什么水域,僧帽水母的分布范围这
-
今晚启动!文化和旅游部将开展全国广场舞展演|世界头条
光明网讯(记者陶媛)6月29日,记者从文化和旅游部2023年第二季度例行