摄影:费锋
大模型是基础生产力,大芯片是建筑材料,从安全土壤里建造一个坚实的元宇宙,瞧!数字人正在向我们走来。
世界人工智能大会至今已经连续举办5届,即便是遭受疫情重击的2022年,依然如期而至。
2018年,初见世界人工智能大会(WAIC),乘坐无人驾驶汽车,看无人机排列出会标,穿梭在旁的是机器人,就像游览一座巨大的未来城。回顾5年的WAIC“镇馆之宝”,你会发现,人工智能从硬件走到软硬件结合,从终端走到底层,从遥望AlphaGo到超越全球顶尖水平。这一切的变化,源自上海对人工智能的坚持。
2022年世界人工智能大会的展品可以总结为“五大”:大模型、大芯片、大平台、大应用、大终端。8月31日,《IT时报》记者探营发现,大模型、AI芯片、数字人是今年世界人工智能大会最值得看的展品,高精尖科技搭建了一座名为“元宇宙”的新世界,先睹为快。
“博士生”大模型
值得看:华为昇腾、百度文心
今年WAIC有八大“镇馆之宝”,大模型就占两席,摘得“状元”和“榜眼”,分别是中国科学院自动化研究院基于华为昇腾AI开发的全球首个三模态模型“紫东太初”,百度文心大模型。
“紫东太初”让AI像人一样思考,能说、会看、会听,它的创新之处在于三模态的协同,即指图像、文本、语音三个模态数据,这等于是从只精通某个领域的大学生,进阶成为精通多个领域的博士生,是全球首个在三模态方向毕业的“博士生”。
“紫东太初”是以华为昇腾AI为基础,依托武汉人工智能计算中心算力而诞生的。全国首个多模态人工智能产业联盟也随之落地,包括新华社新媒体内容检索平台,长安汽车智能座舱、千博手语教考一体机等应用。
华为昇腾AI大模型 摄影:IT时报 孙妍
它还“孕育”出数字人“小初”,“小初”继承了多模态大模型的多项技能,比如视频描述、智能问答、图像检索、吟诗作赋、中文续写、双语翻译、语音识别等。
在国内某纺织企业生产线的全自动生产流程中,真正需要人工操作的是质检环节,但这既耗费人力,生产效率也很低。人工检测精度早70%~80%,自从引入“紫东太初”后,检测错误率降低三分之二。
中国科学院自动化研究院已经开源语音预训练模型、语言预训练模型和视觉训练模型三大基础模型,后续将陆续开源“紫东太初”的十亿、百亿和千亿参数大模型。
华为、百度都是下场做大模型的“大厂”,与华为主攻工业、企业等to B市场不同,百度文心大模型不仅在能源、金融、航天领域得以应用,而AI作画则拉近了文心大模型与C端用户的距离。
“一格”诞生于文心大模型,它是面向创作者开放的AI作画平台,根据人的描述就能现场作画。《IT时报》记者在现场尝试,比如输入“开电动车的雷布斯”,选择写意黑白风格,就能生成颇具未来感的画作;输入“云深不知处”,选择中国画风格,就能生成水墨丹青画卷。
近来,“一句话作画”火遍国外,大神纷纷用DALL·E平台创作画作,但这一工具只有少数人申请到测试资格,于是有工程师开发了“低配版”给网民使用。如今我们迎来了“国产版”,百度“一格”目前仍处于内测阶段,后续有望对用户付费开放。
2019年以后,人工智能研究领域经历了一场由监督学习向无监督学习的范式转变,这标志着一个大模型时代的开始。人工智能要从“可用”走向“好用”,过程中要解决三大难题:AI行业落地难、碎片化严重、模型研发仍处于手工作坊阶段。
时间来到2022年,当模型研发进入工业化时代,通用就成为新趋势,标准化、轻量化、通用化成为强需求。
“反诈先锋”支付宝隐私计算
值得看:蚂蚁“隐语可信隐私计算技术栈”
“隐语可信隐私计算技术栈”排在“镇馆之宝”第三位,不明觉厉,它是蚂蚁集团6年隐私计算技术与应用的集大成者,涵盖千余项隐私计算专利,覆盖所有主流隐私计算技术,首创可信密态计算(TECC)技术等重大突破,可实现一小时内亿级密态样本的建模和分析。
走进蚂蚁展台,一棵科技树占据C位,它根植于“隐语可信隐私计算技术栈”,这个技术可实现数据“可用不可见”“可算不可识”。
隐语可信隐私计算技术栈 图源:蚂蚁
随着多来源、多模态数据的需求越来越强,数据频繁跨平台流通和使用等,引出一系列数据安全和隐私保护相关的问题。如何在数据流通时保障用户隐私?可信隐私计算被业界认为是实现数据要素密态化的关键技术基础设施。
2021年“隐语”可信隐私计算框架和外部数字医疗团队合作,为浙江某三级医院搭建了面向医院运营管理的数据安全融合平台。三个月时间内,这套平台帮助医院累计优化数十万医保结算,并通过编码入组,将医保反馈分析工作量显著降低,甲级病案例病理质控有效提升。
在金融风控中,浦发银行运用可信隐私计算框架“隐语”中的多方安全计算技术,在保护用户隐私和数据安全的前提下,开发风控模型,提升独立自主风控能力,通过多方数据的安全协作将模型KS值大幅提高,不仅识别出十几万名高风险客户,阻止了数十亿人民币的高风险贷款的发放,还识别出了30+万名低风险客户、约80亿元人民币的潜在授信。
离开隐私安全,人工智能一切成果都将如同沙滩上的城堡般不堪一击。
“芯片围城”国产GPU
值得看:天数智芯智铠100、壁仞BR100
在世界人工智能大会召开前夕,美国或对中国断供高端GPU芯片的消息不胫而走。
来自上海天数智芯的7nm高性能AI通用GPU推理芯片“智铠100”,来自上海壁仞的BR100系列GPGPU芯片双双登上“镇馆之宝”。
当芯片先进制程遭遇“卡脖子”困境时,壁仞另辟蹊径,采用Chiplet(小芯片)技术。所谓小芯片,采用28nm成熟工艺芯片,通过异构方式混装,使其功能和性能接近16nm甚至7nm芯片。同时,这也大大降低硅片的成本,“Chiplet设计让我们通过一次流片,同时得到两种芯片,加快迭代速度,同时覆盖不同层级的市场。”壁仞联合创始人、CTO洪洲曾说道。
壁仞BR100就用Chiplet技术实现7nm制程,可容纳770亿颗晶体管,其16浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达PFLOPS级别。据壁仞说法,超过英伟达在售4nm旗舰产品3倍以上,并创下国内互连带宽纪录。
壁仞GPGPU芯片 摄影:IT时报 孙妍
对于一家成立不过3年的芯片创业公司来说,能创造全球通用GPU算力纪录,实属不易。但要指出的是,这一纪录尚属于实验峰值数据,能创纪录主要归功于Chiplet这一创新设计工艺,最后还要在实际落地中打磨其性能。据了解,该GPGPU芯片主要部署在数据中心的服务器中,将为大规模AI训练场景及智慧城市、元宇宙等场景提供算力。
图源:天数智芯
同样,“智铠100”是天数智芯首款7nm制程的云端推理GPU芯片,对标英伟达,将于今年第四季度发布,在今年底量产。据天数智芯称,其最大的优势是通用,“真的可以跑到 100~200 个应用场景”,天数智芯相关人士表示。
数字人正在向我们走来
值得看:商汤“小糖”
在开幕式上,一众数字人虚拟偶像担任迎宾,这在世界人工智能大会历史上尚属首次。
商汤绝影未来座舱 摄影:IT时报 孙妍
在展区,《IT时报》记者偶遇了数字人“小糖”,在商汤绝影未来座舱外,酷飒的“小糖”被路过的记者唤醒,当走进座舱时,她立刻报出记者的身高、体温等健康状况,还跟记者玩起了猜拳、拍照等游戏,全程只需用手势或语音来发出指令,像极了一位懂你的虚拟助手。
不过,像猜拳、拍照等玩法,更适合小朋友。除了视频会议、健康监测外,商汤还可以唤醒数字人更多的互动能力,比如读懂人的喜怒哀乐,播放不同风格的音乐来抚慰人心。
商汤数字人“小糖” 摄影:IT时报 孙妍
类比自动驾驶,数字人也分L1至L5级别,而商汤数字人“小糖”已达L4级别,能够智能交互,但在特定场合还需人工接管。而L5级别则是真正成熟的数字人,可以解决通用性问题,听懂、看懂、有记忆、自学习。
在商汤一站式数字人生产流水线上,数字人被定制成不同的仪容仪表,发往银行、医院、商场、博物馆、健身房等,它们拥有多重身份——讲解员、医生、主播、老师、健身教练等。
全球每天就有一个数字人“诞生”,比起类人机器人,它以更快的速度,渗透人类的世界。也许,得先有数字人,才会有元宇宙。