2022年,人工智能带给人类更多惊喜******
视觉中国供图
在世界人工智能大会上,用户输入文字,AI就能根据语意进行绘画创作。视觉中国供图
在国内首个乘用车无人化运营试点北京经济技术开发区,一辆“主驾无人、副驾驶配备安全员”的无人驾驶车在行驶中。新华社记者彭子洋摄
即将过去的2022年,对于人工智能来说是值得铭记的一年。大批人工智能相关应用走出实验室,向着大范围落地实践不断迈进。AI“黑科技”加持下的北京冬奥会异彩纷呈;无人驾驶开启多城试点,未来交通更进一步;AI绘画以假乱真令人着迷,艺术创作或许不再是人类专属……
无论是底层技术不断突破,还是各类应用百花齐放,在过去的一年,人工智能向我们展示了它的无限可能。我们相信这只是人工智能的冰山一角,未来它还有更多潜力等待我们去挖掘。
随着技术的不断成熟,落地应用不断创新,人工智能或将真正改变你我的生活。
AI“黑科技”照亮北京冬奥会
助力天气预报、比赛转播和手语播报等
2月4日,全球瞩目的2022年北京冬奥会正式拉开帷幕。人工智能等技术的应用为本届冬奥会增添了别样的“科技之美”。
在此次冬奥会上,由中国科学院院士、北京大学副校长、北京大学重庆大数据研究院首席科学家张平文领衔研制的人工智能MOML算法赋能天气预报模型,使冬奥会天气预报更加精准。人工智能算法在融合、处理信息中的先天优势,使其在一定程度上可以代替预报员在会商中进行信息整合、分析,通过数据挖掘与学习,将预报员的经验内化在算法中,在提高天气预报效率的同时,也进一步提高了预报的准确率。
在本届冬奥会自由式滑雪女子大跳台决赛中,中国选手谷爱凌以“逆天”的精彩表现获得个人首金。在比赛转播过程中,百度智能云通过“3D+AI”技术打造出的“同场竞技”系统,将单人比赛项目变成“多人比赛”,实现冠、亚军比赛画面的三维恢复和虚拟叠加,方便观众看到不同选手的实时动作;同时,通过技术手段对运动员动作进行量化分析,将滑行速度、腾空高度、落地远度、旋转角度等一系列运动数据与原始画面叠加起来,使观众可以更直观地从流畅性、完成度、难度、多样性和美观度等角度看懂选手之间的技术动作差异。
在北京冬奥会开幕的同一天,央视新闻AI手语主播也正式上岗,她在冬奥会新闻播报、赛事直播和现场采访中,为听障人士送上了实时手语翻译服务。凭借精确的手语翻译引擎,该AI手语主播可懂度达85%以上,可将冰雪赛事的文字及音视频内容,快速精准地转化为手语。
腾讯“混元”AI大模型登顶VCR榜单
展现了其在多模态理解领域的强大实力
5月31日,腾讯“混元”AI大模型在多模态理解领域国际权威榜单VCR(Visual Commonsense Reasoning,视觉常识推理)中登顶,两个单项成绩和总成绩均位列第一。这是继在跨模态检索领域大满贯、CLUE自然语言理解分类榜及CLUE总榜登顶后,“混元”AI大模型的又一重大突破,展现了其在多模态理解领域的强大实力。
与跨模态理解任务不同的是,多模态理解任务要求计算机除了能够做到识别层次的感知(如分类检测等),还需要达到认知层次的感知(如判断意图、逻辑推理等)。
此次登顶VCR榜首的“混元”AI大模型由腾讯广告多媒体AI团队自主研发,同时借助腾讯太极机器学习平台的图形处理器算力和训练加速框架,在预训练任务、训练方式上进行了诸多创新改进和设计,有效提升了模型性能。
截至目前,“混元”AI大模型在MSR-VTT、MSVD、CLUE、VCR等多个领域的AI权威榜单中取得了第一名的成绩,并刷新多项行业历史纪录。这意味着,“混元”在自然语言理解、多模态理解、跨模态理解等领域的技术实力已得到验证。
谷歌工程师闹乌龙,称AI存在意识
人工智能所谓的“人格”更多只是模仿人类罢了
谷歌AI工程师闹乌龙,称LaMDA语言模型有意识,引发业界对“AI是否拥有自主意识”的讨论。
今年6月,谷歌公司AI工程师莱莫因认为对话应用语言模型LaMDA具有了“自主意识”,并对此出具了长达21页的证据。莱莫因认为LaMDA具有意识的原因有三:一是LaMDA以前所未有的方式高效、创造性地使用语言;二是它以与人类相似的方式分享感觉;三是它会表达内省和想象——既会担忧未来,也会追忆过去。
LaMDA是谷歌在2021年开发者大会上公布的大型自然语言对话模型,它可以模拟任何带有知识属性的实体,通过“拟人”的方式,在与人类亲切自然的对话中为用户答疑解惑,传递更多知识。
莱莫因的观点和证据引起了业内的广泛关注。不久后,谷歌发表声明称,莱莫因违反了“就业和数据安全政策”,将其解雇。谷歌表示,经过广泛地审查,他们发现莱莫因关于LaMDA是有生命的说法是完全没有根据的。
专家普遍认为,当下人工智能具有的所谓“人格”,更多只是模仿人类的语言风格,有自我意识、有感知能力的AI应该具备能动性,并具有独特的视角看待人和事,但目前AI还只是人们设计的一个计算机系统,作为工具来做一些特定之事。
全球首个图、文、音三模态大模型诞生
“紫东太初”实现“以图生音”和“以音生图”
9月1日,在上海举办的2022世界人工智能大会上,由武汉人工智能研究院、中国科学院自动化研究所和华为技术有限公司联合研发的“紫东太初”多模态大模型项目获得了此次大会的最高奖项。“紫东太初”是全球首个图、文、音三模态大模型,开创性地实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”,实现了“以图生音”和“以音生图”,理解和生成能力更接近人类,为打造多模态人工智能行业应用提供创新基础,向通用人工智能迈出了重要一步。
“紫东太初”三模态间的相互转换和生成,其核心原理是视觉、文本、语音不同模态通过各自编码器映射到统一语义空间,然后通过多头自注意力机制学习模态之间的语义关联以及特征对齐,形成多模态统一知识表示;之后,再利用编码后的多模态特征,通过解码器分别生成文本、图像和语音。
“紫东太初”凭借四大突破,有效助力以多模态认知为核心的通用人工智能发展。一是首次提出多层次、多任务跨模态自监督学习框架,支持从词条级走向模态级、样本级的三级预训练自监督学习方式;二是首次完成弱关联多模态数据语义统一表示,减少数据收集与清洗代价;三是首次实现多模态理解与生成任务的统一建模,支持跨模态检索、多模态分类、语音识别、图像生成等理解与生成任务;四是首次实现无监督超越有监督方法,基于5%—10%的数据标注,实现100%的有监督学习效果。
AI打破矩阵乘法计算速度纪录
解决了50年来数学领域一个悬而未决的问题
10月,英国《自然》杂志封面以“矩阵游戏”为题,发表了人工智能公司“深度思维”团队的最新发现:AI可以解决矩阵乘法问题。这款名为“AlphaTensor”的AI系统能自行发现新算法,从而解决了50年来数学领域一个悬而未决的问题——找到两个矩阵相乘最快的方法。这是第一个可为矩阵乘法等基本任务发现新颖、高效且正确算法的AI系统。
数学在计算机编程中经常出现,通常作为描述和操纵现实世界现象表示的一种手段。例如,它可用于表示计算机屏幕上的像素、天气状况或人工网络中的节点。在这种情况下,使用数学的主要方式之一,就是对矩阵进行计算。矩阵越大,工作量也越大,计算机科学家开始花费大量时间和精力开发更加有效的算法来完成相关工作。
在此次最新成果中,“深度思维”团队研究人员探究了是否有可能使用基于强化学习的AI系统来创建新算法,从而使计算步骤比现有算法更少。
为了找到答案,他们从游戏系统中寻找灵感。在构建了一些初步系统之后,研究团队将重点转向了树搜索,这是系统在特定情况下查看各种方案的一种方法。
接下来,研究人员将允许系统创建自己的算法,进一步提高效率。他们发现,在许多情况下,系统选择的算法比人类创建的算法更好。“深度思维”团队希望,未来AI能更多地用来帮助攻克数学和科学领域的一些重要的难题。
2022中国人工智能创新发展指数公布
全面反映我国人工智能发展态势
11月18日,第五届世界声博会暨2022科大讯飞全球1024开发者节开幕式上,中国电子信息产业发展研究院(又称赛迪研究院)发布了2022中国人工智能创新发展指数(合肥指数)。
这是国内首个以地区冠名的全国性人工智能专题研究成果,旨在全面系统地反映我国人工智能的发展态势。中国电子信息产业发展研究院从发展环境、创新能力、基础配套、资本投入和产业实力5个维度,构建了中国人工智能创新发展指数,也就是“合肥指数”的评价体系。
近年来,我国人工智能步入与经济深度融合应用新阶段,智能化转型全面推进,人工智能产业在全球的影响力不断增强。2021年,我国人工智能的研发强度为19.4%,从业人数增加到31万人,占全球比重的5.3%。2017年至2021年,我国人工智能产业规模增长了2.6倍,占全球比重提升到16.8%。专利申请量占全球比重持续扩大,从2012年的13%增长到2021年的70.9%。创新能力上,我国人工智能研发投入力度不断加大,从业人数不断增加。
从总体指数来看,北京、广东和上海处于人工智能领域的领跑地位,安徽则紧随其后,排在全国的第6位。合肥已经成为人工智能领域、科技创新与产业发展最活跃的城市之一。
ESMFold预测六亿多种蛋白质结构
预测速度比“阿尔法折叠”快60倍
英国“深度思维”公司8月曾宣布,其开发的人工智能程序“阿尔法折叠”已预测出约100万个物种的超过2亿种蛋白质结构,几乎涵盖了科学界已编录的每一种蛋白质结构。但就在今年11月,元宇宙平台公司(Meta)研究人员利用人工智能模型ESMFold预测了来自细菌、病毒和其他尚未被表征微生物的6亿多种蛋白质结构。
在此次最新研究中,研究团队利用大型语言模型来预测这些蛋白质结构。据悉,语言模型通常需要大量文本进行训练,为将这一模型应用于蛋白质结构预测,研究团队利用已知的蛋白质序列来训练它,这些已知的蛋白质可由20个不同氨基酸组成的链来表达,每个氨基酸由一个字母表示。然后,ESMFold学会了用模糊的氨基酸比例“自动完成”蛋白质结构预测。
该团队负责人亚历山大·里维斯表示,这些训练让ESMFold对包含蛋白质形状信息的蛋白质序列有了直观了解。而且,与“阿尔法折叠”一样,这一模型能将这些了解到的信息与已知蛋白质结构和序列之间的关系信息结合,生成预测结构。
团队指出,ESMFold的预测虽然不像“阿尔法折叠”那么准确,但在预测速度上要快60倍,这意味着它可将结构预测数据库扩展到更大。
首创蛋白质动态结构AI建模方法
对理解生命过程、研发新型药物有着重要意义
12月8日,西湖大学公布了该校人工智能讲席教授李子青团队联合厦门大学、杭州德睿智药科技有限公司首创研发的能够刻画蛋白质构象变化与亲和力预测的AI模型——ProtMD。这是第一个尝试解析蛋白质动态构象的人工智能模型,可辅助药物化学专家更加精准地筛选出高活性小分子,从而加速临床前药物研发。
此前谷歌旗下公司研发的“阿尔法折叠2”能够利用人工智能准确预测蛋白质的三维结构,对结构生物学、药物设计乃至整个科学界都产生了巨大影响。但“阿尔法折叠2”只能预测蛋白质在一个瞬间的静态结构,尚未能解决蛋白质结构动态变化的预测。李子青团队此次开发的AI模型,在给定药物分子和靶点蛋白的情况下,可预测药物分子与生物体内靶点蛋白质结合(柔性对接)后蛋白质结构的变化过程,推断药物与靶标蛋白结合的稳定性,预测药物功能,从而提升AI药物设计的精度和效率。
李子青表示,预测蛋白质结构的动态变化对理解生命过程、研发新型药物都有着十分重要的意义。尤其在AI药物设计中,通过对药物分子与靶点蛋白结合后的动态结构变化进行预测,评估药物—靶点结合亲和力和药物效果,是提高AI药物筛选准确性和效能的重要思路。
多城市推动自动驾驶行业发展
我国自动驾驶行业正式向L3级迈进
2022年是自动驾驶行业具有里程碑意义的一年,有关政策密集出台,相关应用从研发测试走向大规模商业化试点。当前,全国近30个城市已累计为80余家企业发放了超过1000张道路测试牌照,允许高等级智能网联汽车在特定场景、特殊区域内开展规模化载人载物测试示范。越来越多的城市正在推进更高等级的自动驾驶商业化。
今年8月1日,《深圳经济特区智能网联汽车管理条例》开始实行,该条例提出L3级自动驾驶在行政区全域开放道路测试、示范应用,探索开展商业化运营试点,标志着我国自动驾驶行业正式向L3级迈进。
此后,重庆、武汉等地政府部门也先后发布了自动驾驶全无人商业化试点政策,并向百度发放全国首批无人化示范运营资格,允许车内无安全员的自动驾驶车辆在社会道路上开展商业化服务。
此外,为推动智能网联汽车产业健康有序发展,工业和信息化部会同公安部还组织起草了《关于开展智能网联汽车准入和上路通行试点工作的通知(征求意见稿)》,拟遴选符合条件的道路机动车辆生产企业和具备量产条件的搭载自动驾驶功能的智能网联汽车产品,开展准入试点;对通过准入试点的智能网联汽车产品,在试点城市的限定公共道路区域内开展上路通行试点。
AI绘画火了,AIGC元年开启
未来预计能够产生万亿级经济价值
今年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者杰森·艾伦提交的AIGC绘画作品——《太空歌剧院》,获得了此次比赛“数字艺术/数字修饰照片”类别一等奖。没有绘画基础的杰森·艾伦借用了一款名叫Midjourney的AI绘图工具,通过一个类似“文字游戏”的过程,输入题材、光线、场景、角度、氛围等有关画面效果的关键词后,得到了初始作品,并在反复调整和修改后最终完成了这组“太空歌剧院”数字艺术作品。
这一年,AI绘画小程序、网站等开始迅猛增长,而美图秀秀、抖音等软件也加入了AI画图功能。抖音平台数据显示,截至12月6日,已有超2428.4万人使用该特效,迅速飙升至特效潮流榜第一位。AI绘画的百度指数也从日均两三千上升到日均3万,火爆程度可见一斑。
AI绘画的火爆也让AIGC这一概念逐渐进入大众视野。
所谓AIGC(AI Generated Content),即基于人工智能技术自动生成内容的新型生产范式。其技术主要涉及两个方面:自然语言处理(NLP)和AIGC生成算法。其中,自然语言处理是实现人与计算机之间通过自然语言进行交互的手段。
最初,AIGC可生成的内容形式以文字为主,经过2022年指数级的发展,目前AIGC技术可生成的内容形式已经拓展到了包括文字、图像、视频、语音、代码、机器人动作等多种内容形式,2022年也因此被称为“AIGC元年”。生成式AI让机器开始大规模涉足知识类和创造性工作,未来预计能够产生数万亿美元的经济价值。(科技日报实习记者 都芃)
“野冰场”暗藏杀机:冰层厚度未知 无人管理和救援******
冰层厚度未知 无人管理和救援 短视频博主推荐
人如织的“野冰场”暗藏杀机
□ 本报记者 赵 丽
□ 本报实习生 王禹钦
近日,吉林省通化市一名5岁男童和家人在河流上的“野冰场”玩耍时,不慎坠入冰窟窿溺亡,引起社会广泛关注。
《法治日报》记者根据公开信息梳理发现,近一个月内,全国多地发生因滑“野冰”导致的伤亡事件。对此,消防部门提醒,禁止滑“野冰”等危险行为,市民应前往正规冰场游玩。
受访专家认为,对于无人管理的河道形成的“野冰场”,即使有小贩在“野冰场”出租冰车等,也不是“野冰场”的管理方,不是经营主体,不承担警告危险和劝离义务,一旦人们在这种场所发生事故,将自担责任。群众要有风险意识,远离“野冰场”。
冰面下隐藏着危险
多人坠冰导致身亡
1月7日,在北京展览馆后湖的“野冰场”,多名游玩者因冰面突然破裂落入水中。
“现在想想还很后怕。”参与北京展览馆后湖“野冰场”救人的一名大学生描述当天情景时说。
据悉,落水者都是大学生,寒假开始后选择在那里相聚玩耍,然后就发生了意外。
“我的一个好朋友不会游泳,他挣扎着时不时地把头冒出冰面喘口气,不知道喝了多少口冰水。”这名大学生说。对于当时的危险程度,他“现在想想还心惊肉跳”,冰面又薄又滑,他死命拽着救人的绳子,要是力气再小点,估计会被水里的同学拉下去。
事发当日的现场视频显示,冰面破裂后,至少4名穿深黑色棉服的游玩者落入水中,周围多名救助者快速组成一道道“人墙”,找来绳索等工具,通过手拉手的方式慢慢向落水者靠近,等落水者抓住绳索后,再合力将其从水中拉回冰面。
记者注意到,在破裂冰面附近的围观者中,还有多名儿童。
1月9日,记者在北京展览馆后湖的“野冰场”附近看到,仍有市民在冰面上“滑野冰”,其中不少是家长带着孩子玩乐,冰面上还有租赁滑冰车的人。
冰上的嬉戏欢笑和湖岸上新挂的红色警示横幅形成了鲜明对比。横幅上写着“湖面危险,请勿滑冰”和“岛内施工尚未结束,为了您的安全请勿进入”。
记者查阅资料发现,北京展览馆后湖并不在今年北京水务系统开放的天然河湖冰场之列,因此,在此滑冰实属危险的滑“野冰”行为。
危险的滑“野冰”行为不仅在北京展览馆后湖出现。1月8日,在北京市朝阳区奥林匹克公园龙形水系的一处冰面上,也发生了市民坠冰事故。
据当时在场的一名短视频博主回忆:有人玩耍时不小心掉进了冰窟窿,有两人前去施救时也一同掉了下去,最终几人均被救出,并无大碍。周围群众对待这起事故的态度令人担忧。
“就在事发地的旁边,落水的人刚爬上来,就有个两三岁的孩子往冰面上走,旁边的家长也没有迅速带孩子离开这片区域。”该博主告诉记者。
根据该博主拍摄的视频,记者看到,在落水者离开后,还有人在附近用冰锥试探。“这片‘野冰场’上,破裂的冰洞不止一个,但这样的场景也未能劝阻在冰面上滑行的人,不少大人、小孩仍继续在冰面上玩耍”。
而在岸边,每隔一段就有提示游客的牌子,上面写着“为了您的生命安全,请勿在冰面上玩耍”,在一处围栏上还挂着一只大喇叭,不断重复播放着“冰面太薄,请不要滑冰”的警告。
随后两天,记者探访了北京多处“野冰场”发现,尽管许多“野冰场”边上设有“冰面危险,请勿滑冰”的警示标语,有些地点甚至还有工作人员拿着喇叭进行巡逻劝阻,但仍有滑冰的拥趸套上冰鞋,拿上冰球杆,推上滑冰车,三五成群走上冰面,遇上带着孩子的游玩者,不少租赁滑冰车和冰鞋的商贩还会上前招揽生意。
不少游玩者告诉记者,尽管他们注意到了相关提示语,但觉得“这么多人在这里玩,不会出事的”。
多名业内人士说,冰面光滑、易碎,冰水寒冷,一旦不小心落入冰窟窿中,施救难度非常大。冰面的承重能力,用眼睛是无法观察到的。同时,在流动河道上结冰的冰面,由于河水水位会随着水量的大小发生变化,冰面下会形成两三厘米的“真空”,隐藏着危险。
有关部门发布的数据显示:近期,仅北京市119指挥中心就接到多起冰面救援警情,其中多人命丧冰水之中。去年12月23日,北京市密云区一名男性老者被冻在厚厚的冰层中,被救出时已无生命体征;今年1月2日凌晨,北京市通州区漷县镇,两名男子发生坠冰事故,被救出时均已无生命体征。
网络博主包装推广
危险河湖成打卡地
值得注意的是,有些北京郊区的“野冰场”经网络博主“种草”后,变成网红踏冰地,其安全隐患更是令人担忧。
京郊“小洱海”,北京“天空之镜”……近日,一些京郊地区在网上火“出圈”,但这些踏冰场所大多位置偏远,有的野外河道宽达百米,地形复杂,冰层厚度肉眼难以测量。
而在一些社交平台和短视频平台上,不少网络博主将这些暗藏危险的冰面用“绝美”“免费”“出片”等诱人的词汇进行包装,吸引一拨拨爱好者慕名前往,有关“野冰场”的话题甚至超过千万播放量。在这些视频中,除了个别警示滑“野冰”危险外,更多的是展示在“野冰场”上滑行、跳跃的内容。
虽然也有博主提及部分冰面不结实,打卡要注意安全,但更多博主则对这些“野冰场”的安全性闭口不提,甚至直言“这里已经冻结实了”“可以随意玩耍”“在这里打卡拍照太划算了”。
在诸多网络热帖下留言的网友,多数被网络博主分享的“震撼大片”所吸引,纷纷向博主求具体地址。还有网友将自己落水的危险经历当成趣事分享。仅有少数网友留言提到这些河道地形复杂,有些地方冰面薄暗藏风险。
据记者调查发现,上述推荐的“野冰场”包括河流、水库等,在一些拍摄者的视频中,可以明显看到冰面下有河水流动,在一些冰面上有凸起的“冰棱”,这样的冰面并不结实,危险重重。
在社交平台上,除了分享“野冰场”的位置,网友还晒出自制的简易滑冰车,其安全性着实让人担忧—— 一把普通的靠背椅、两根铁棍、几根铁丝就能滑。
中国政法大学知识产权研究中心特约研究员赵占领分析,推荐的“野冰场”发生事故,无论是发帖博主,还是网络平台,从法律角度来讲,都很难要求其承担法律责任,因为无法证明这种推荐和受到意外伤害之间有因果关系。
前往正规冰场游玩
专人巡视保障安全
用大石头砸一下,冰碴儿飞溅,但冰面并没有出现裂痕甚至窟窿,似乎就是“可以上冰”的信号;或者直接先踩上去一只脚探探“虚实”……记者在调查中看到,很多人用这种方式“检测”冰面厚度,以此来判断“野冰场”是否安全。
殊不知,这样的“试探”在专业救援人员看来,实际上“就已经是在拿自己的生命开玩笑”。
据了解,在北京,正规冰场都安排有专门人员留意气温变化,监控冰层厚度。按照北京市相关规定,冰层平均厚度至少要达到15厘米,才能允许游客上冰;当气温升高,冰层厚度不足、承载力有限时,冰场会暂停营业。
据什刹海公园冰场负责人杨谦介绍,冰场工作人员一般会用钢钎在冰面上砸出一个小洞,将铁钩伸进去,钩住冰层底部。取出铁钩后,再用卷尺直接量铁钩在冰面以下的距离。每次测量需选向阳面、背阴面等五六个测试点,以确保安全。
什刹海公园冰场设专职人员全天候巡视,严格执行“冰面平均每10平方米承载1人”的规定;坚持每天早、中、晚对冰层厚度进行测量,随时关注天气预报信息,适时增加冰层测量次数。同时设置应急救援队,有诸如摔伤、踩踏以及冰面裂缝等突发情况,救援队会第一时间到达现场,采取措施避免出现人员伤亡。
对于“野冰场”,有关部门还发布了安全风险提示。去年12月30日,北京市应急管理局提醒市民前往正规冰场游玩,禁止滑“野冰”等危险行为。
赵占领说,对于无人管理的河道形成的“野冰场”,即使有小贩在“野冰场”出租滑冰车等,也不是“野冰场”的管理方,不是经营主体,不承担警告危险和劝离义务,一旦人们在这种场所发生事故,仍是自担责任。因此,为避免这样的事故发生,还是要加强安全教育、安全宣传,让老百姓意识到安全的重要性,不要去“野冰场”。
他提醒说,对于公园、景区内的河道形成的“野冰场”,公园或景区的经营主体具有安全管理和提醒的义务。如果管理区域不能滑冰,要设置警示牌、配备巡逻人员,发现滑冰者要及时制止。如果因为管理不到位导致游客“滑野冰”发生事故,管理方需要承担相应责任,但也只是次要责任,主要责任仍是由行为人自己承担。
(文图:赵筱尘 巫邓炎)