ChatGPT的火热掀起了国内外对大模型的探索热情,即便是一边呼吁暂停AI研究以防“失控的人工智能”的马斯克,近期也被曝正在推特内部启动人工智能项目。
不管是差GPT“2个月”还是“3年”,国内大模型一夜之间已经遍地开花。继百度打响国内大模型第一枪后,目前阿里、京东、华为等互联网大厂,商汤、昆仑万维等科技公司也纷纷推出了自家的大模型,包括内容平台知乎也在4月13日推出了中文大模型“知海图AI”。
另一边,王小川、王慧文等互联网大佬的大模型也有了新进展。在获得5000万美元启动资金后,4月10日,王小川官宣AI大模型公司“百川智能”;王慧文的 “光年之外”在A 轮融资后估值已达到10亿美元。
接下来大模型的热潮将继续。虽然没有直接推出大模型产品,但腾讯已经发布“国内性能最强的大模型算力集群”,同花顺、科大讯飞等正在跑步入场。
与此同时,有关大模型的讨论也在继续,我们需要这么多大模型吗?在这场大模型的同台竞技中,谁能最终脱颖而出,打造出中国的OpenAI?
百度“文心一言”大语言模型
被称为中国版ChatGPT的百度“文心一言”于3月16日14:00在百度北京总部大楼正式发布。百度在会上用PPT展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
百度同时公布了文心一言的邀请测试方案。发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆。截至3月27日,百度文心一言已收到12万家企业申请测试。
从港股市场表现来看,发布会当天,百度港股一度跳水跌超10%,百度当日股价最终跌近8%。但第二天,百度港股又大涨13.67%。
不过,作为国内第一款官宣的大模型,文心一言被追捧,也被质疑。
在发布会结束大约一周后,文心一言深陷套皮质疑。
微博博主“刘大可先生”发文质疑文心一言文生图功能抄袭“StableDiffusion”,同时在中文语义理解方面存在局限。他称,找到了对文心一言更多的不利证据,恐怕是和汉芯、鸿蒙一样的东西:套壳、画皮、造假。
3月23日,百度官博发文称,注意到对文心一言文生图功能的相关反馈,并针对质疑做出澄清。百度称,文心一言完全是百度自研的大语言模型,在大模型训练中,其使用的是互联网公开数据,符合行业惯例。
3月27日,百度正式推出“文心千帆”大模型平台。文心千帆大模型平台,整合了百度全套文心大模型、相应的开发工具链,未来还会支持第三方的开源大模型。在现场实时演示中,文心千帆可实现三分钟做ppt、数字人直播带货、订机票和酒店等操作。
4月3日,百度地图V18版本发布。该版本由文心交通大模型和生成式AI提供底层支撑,可面向实时交通实现刻画、感知、预测、调度的端到端优化。一同发布的还有领航数字人叶悠悠。介绍称,叶悠悠可与车主实现拟人级语音交互。
阿里云“通义千问” 大语言模型
4月7日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出。
据介绍,通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够帮助用户续写小说,编写邮件等。现阶段该模型主要定向邀请企业用户进行体验测试。
另外,阿里巴巴决定未来将所有产品接入通义千问,进行全面改造。据悉,钉钉、天猫精灵将率先接入通义千问测试,评估认证后正式发布新功能。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,面向AI时代,所有产品都值得用大模型重做一次。
目前,通义千问仅支持自然语言处理,尚不支持文生图等跨模态功能,不过有知情人士称,后续通义千问也会尽快推出相关大模型,能够支持更多功能。
早在去年9月,阿里巴巴就已经发布了通义大模型系列,包括通义M6、Alice mine以及视觉模型。单一模型可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。资源消耗也不高,以当时通义系列中的M6大模型为例,相同参数规模下训练能耗仅是GPT-3的1%。
华为“盘古系列AI大模型”
4月8日至9日,由中国人工智能学会主办的人工智能大模型技术高峰论坛将在杭州萧山举办。有媒体从华为云官网推测,华为即将上线的“盘古系列AI大模型”分别为NLP大模型、CV大模型、科学计算大模型(气象大模型)。
其中NLP大模型是被认为最接近人类中文理解能力的AI大模型,而CV大模型首次兼顾了图像判别与生成能力。盘古CV大模型覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖了智能文档检索、智能ERP、小语种大模型等领域。
4月10日消息,针对上述情况,华为云方面暂未回应。
与此同时,有媒体经从华为云官方微信、微博等官方渠道查证,华为云从未明确表示4月将发布新的大模型,也从未透露过有关盘古大模型的产品计划。华为云人工智能领域首席科学家田奇也并未在本次论坛中透露盘古大模型的产品上市计划。知情人士透露,华为云即将上线盘古系列AI大模型疑似资本炒作。
商汤日日新大模型
4月10日,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型体系。据悉,日日新大模型体系主要包括自然语言生成、文生图、感知模型标注、以及模型研发功能,即“商量(中文语言模型)”、“秒画(文生图)”、“如影(数字人视频生成)”、“琼宇(场景生成)”,“格物(物体生成)”。
商量:使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。
秒画:可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节。
如影:可以帮助用户轻松创作视频,支持AI数字人动作表情、AI文案生成、AI跨语言文稿、AI素材生成的全栈式智能创作,卡通/真实多风格变换自如。
琼宇、格物:它们是商汤科技基于神经辐射场技术(NeRF)的3D内容生成平台,可基于3D内容生成技术实现对空间和物体的复刻与交互,大到城市数字孪生,小到桌面手办,都能逼真复刻。
商汤方面表示,该技术主要面向B端,商汤日日新大模型体系目前仅面向政企客户开放API接口,客户可登录商汤官网申请。
不过,商汤在现场展示秒画时,有眼尖的网友发现商汤所演示的精选模型中出现AI模型站civitai的图片,该模型底部有显示civitai的文字水印,引发了网络质疑。
对此,商汤方面表示:秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型,支持导入多个平台的开源模型或上传用户本地模型。用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。”在现场演示中,该模型底部有显示civitai的文字注释。
科大讯飞 “1+N认知智能大模型”
在今年3月举行的沪港创新发展论坛上,科大讯飞集团总裁吴晓如表示,以ChatGPT为代表的技术表明机器在自然语言的处理能力上已实现质的飞跃,应该看到和Open AI的差距并迎头追上。科大讯飞已储备了一段时间,很快会发布自己的大模型技术。
4月11日,科大讯飞在互动平台表示,讯飞依托认知智能全国重点实验室的长期积累,于2022年12月份启动生成式预训练大模型“1+N”任务攻关,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。
关于讯飞预训练大模型的详细信息将于2023年5月6日产品发布会上进行发布。
受此消息影响,科大讯飞和人工智能板块大涨。
昆仑万维 “天工”3.5大语言模型
4月10日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型 ——“天工”3.5 发布在即,并将于 4 月 17 日启动邀请测试。未来,“天工”4 和“天工”5 也将与大家见面。
“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,因此昆仑万维把此版本命名为“天工”3.5。“天工”作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景。
4月11日,昆仑万维在前一天暴跌之后,当天强势反弹大涨9.5%,其中盘中最高上涨近16%。
与此同时,昆仑万维4月11日收深交所关注函,要求说明“天工”3.5可能面临的风险。
4月13日,昆仑万维回复深交所关注函时表示,“天工”3.5可能面临的风险包括:技术研发进展不及预期的风险;应用实践商业化不及预期风险等。昆仑万维表示,目前公司AIGC、人工智能等业务产品尚未产生实际收入,预计对公司2023年财务状况不会产生较大贡献。
知乎“知海图AI”中文大模型
4月13日,知乎创始人、董事长兼CEO周源在“2023知乎发现大会”上宣布,知乎联合面壁智能发布中文大模型“知海图AI”,邀请AI加入知乎“讨论场”。
知乎方面表示,在特定场景中,把“知海图AI”大模型的效果与GPT-4进行了比较,两个模型几乎是持平的。
“知海图AI”中文大模型已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
受此消息影响,知乎美股盘前一度暴涨15%。
据悉,“知海图AI”是基于面壁智能自主研发的CPM企业级大模型与ModelForce大模型系统。
面壁智能团队早在2020年底就发布了首个中文大语言模型CPM-1,三年时间内又陆续发布了CPM-2、CPM-3和CPM-Ant、CPM-Bee等开源模型。
毫末智行“雪湖·海若”自动驾驶算法模型
4月11日,毫末智行正式官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。
该自动驾驶生成式大模型“雪湖·海若”通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,最终实现端到端自动驾驶。
据介绍,“雪湖·海若”通过引入驾驶数据建立RLHF技术,对自动驾驶认知决策模型进行持续优化,最终目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题。
目前,“雪湖·海若”实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据。
据了解,2021年,毫末智行在推出数据智能体系MANA的同时,也宣布要借助大模型提升数据处理能力,从而加速HPilot智能辅助驾驶产品的进化。
王小川成立“百川智能”
4月10日,搜狗创始人王小川正式宣布入局中国大模型创业,和前搜狗COO茹立云联合创立人工智能公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。
王小川在公开信中表示,新公司名为“百川智能”,目前已初步组建了50人的团队,获5000万美元启动资金,争取年内发布国内最好的大模型和颠覆性的产品。
据悉,百川智能以前搜狗团队为基础,快速融合了来自百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖AI人才。
值得一提的是,近日,王小川与百度副总裁肖阳就国内大模型发展与OpenAI之间的差距问题,隔空打起了嘴仗。
这场嘴仗源于王小川对李彦宏谈及“百度的文心一言和OpenAI差距可能在两个月左右”的观点不认同。王小川表示:“怎么可能只差两个月?那一定是(在)另一个宇宙。”如果用时间衡量的话,王小川认为OpenAI比国内领先三年时间。
针对上述观点,百度副总裁肖阳回应称:“百度做AI,始终相信长期主义的价值。我们向来不回避与国外的差距,但是这个差距到底在什么位置,一线的都懂。天上一天,人间一年,王小川脱离一线太久,确实跟我们不在一个宇宙。”
今日凌晨,王小川回怼了百度副总裁肖阳的言论。王小川称,“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人。”
马斯克被曝入局大模型
据外媒援引知情人士称,特斯拉CEO埃隆·马斯克近日在推特内部启动了一项人工智能项目,用于公司的两个数据中心之一。
知情人士透露,尽管马斯克签署了呼吁暂停人工智能开发6个月的公开信,但其却暗中在推特推进新的生成式人工智能(AIGC)项目,并为此购买了上万个GPU(图形处理器),还从谷歌的人工智能部门DeepMind招募了人才。
该项目涉及创建一个生成式人工智能,推特将根据自己的海量数据进行训练。一位消息人士称,如果推特不打算将它们用于AI工作,几乎没有理由在数据中心级GPU上花费这么多钱。
知情人士称,马斯克的人工智能项目还处于早期阶段,尽管其购买如此多的额外计算能力表明他对这个项目给予了很大期望。
此外,今年2月,马斯克与人工智能研究人员接洽,商讨成立一个新的研究实验室,以开发ChatGPT的竞争对手。
值得一提的是,他不止一次在公开场合称人工智能是一项危险的技术。就在几周前,他还和人工智能研究界和产业界的大佬们一起签署了一篇公开信,呼吁全球所有实验室暂停比GPT-4更强的AI模型研发,暂停时间至少为6个月。
本文来自微信公众号“鞭牛士”(ID:bianews8),作者:元鹅 Julie张