向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
东西问·解码兔年 | 李茜:兔年说兔,谁是地球上兔子的“老祖先”?****** 编者按: “万物迎春送残腊,一年结局在今宵”。中国传统的兔年春节将至,历经疫情考验的人们心怀希冀。自2023年1月18日起,中新社“东西问”专栏特推出“解码兔年”系列稿,探究春节文化、“双立春”等的意涵与影响。
中新社北京1月21日电 题:兔年说兔,谁是地球上兔子的“老祖先”?
——专访中国科学院古脊椎动物与古人类研究所研究员李茜
中新社记者 孙自法
2023年是中国传统的癸卯兔年。兔子以其活泼好动的特点,颇受人们的追捧与喜爱。
可爱的兔子如何起源演化而来?这个问题一直备受古生物学界关注,也引发诸多争议,直到20世纪70年代,中国科学院古脊椎动物与古人类研究所(中科院古脊椎所)野外考察队在安徽潜山约6200万年前地层中发现并命名为“安徽模鼠兔”的化石,研究确认它是兔子的祖先类型,才平息了兔子起源争论。
安徽模鼠兔何以成为“兔祖先”?其后又经历了怎样的演化过程?研究上还有哪些未解之谜?兔年到来之际,中科院古脊椎所研究员李茜在北京接受中新社“东西问”专访,兔年说兔,科普揭秘兔子的“前世今生”。
现将访谈实录摘要如下:
视频:【东西问】李茜:中国发现的化石为解决“鼠兔同源”争议提供关键证据来源:中国新闻网
中新社记者:兔子起源研究在古生物学界曾有哪些争论?安徽模鼠兔化石的发现,为兔子起源和鼠兔同源研究提供了怎样的关键证据?
李茜:今天大家都喜欢的兔子这种小动物,它在世界上虽然分布广泛但分类上并不庞杂。在古生物研究历史上,关于兔的起源曾经有非常多的争论,包括兔可能跟踝节类有关系、兔可能起源于亚洲特有的一类生物等,鼠兔是否同源也是学界长期争议的话题,因为缺少关键的化石证据,所以很长时间没有达成共识。
6200万年前“兔祖先”安徽模鼠兔的复原图。中科院古脊椎所 供图直到20世纪70年代,中科院古脊椎所在安徽潜山盆地发现约6200万年前的安徽模鼠兔化石,古生物学界对兔的起源才有了全新认识。
安徽模鼠兔化石发现时,虽然头骨材料并不完整,但它的门齿、颊齿这些很重要的结构都被保存下来,一些下颌材料也提供了非常重要的特征。科学家们通过仔细分析和深入研究发现,安徽模鼠兔的上门齿跟今天兔子相关的结构特征非常接近,包括上门齿都是两对、前一对从前面观察能够看到表面有纵沟等。根据这一系列结构特征分析,科学家认为安徽模鼠兔跟现生兔子是有关联的,代表了今天兔子的祖先类型。
在发现安徽模鼠兔同一盆地同时还发现另一类非常重要的、命名为“东方晓鼠”的化石。安徽模鼠兔具有现生兔类特征,跟今天的兔子有亲缘关系,因此是“兔祖先”;东方晓鼠则具有一些啮齿类也就是鼠类的特征,可以说是“鼠祖先”。
这两类化石不光一个像兔一个像鼠,同时又“你中有我、我中有你”存在很多相互交混的特征,这为解决鼠兔是否同源的争议,提供了非常好的化石证据,经过对比研究最终提出鼠兔同源的观点。
6200万年前“兔祖先”的安徽模鼠兔化石。孙自法 摄中新社记者:安徽模鼠兔如何演化出今天的兔子?从约6200万年前至今,兔子演化进程中有哪些重要分支节点?整体上呈现怎样的演化趋势?
李茜:分别作为兔、鼠祖先类型的安徽模鼠兔和东方晓鼠在约6200万年前同地同时被发现,约5800万年前的古新世和始新世之交,兔形目和啮齿目就已经分开,开始各自独立的演化。
整体上,兔子在地球上的分布及演化是一个较为连续的过程,但它们在不同大陆上出现的时间并不一致:亚洲最早的兔形目化石记录是大约5300万年前,北美最早的记录是约4300万年前,欧洲要相对晚一些,大约2500万年前才有可靠的化石记录,非洲最晚,1900万前才有化石兔形类的出现。
中国不仅发现安徽模鼠兔化石,还在内蒙古约5300万年前的早始新世地层中发现目前已知最早的兔形目化石,将其命名为“远古道森兔”,在河南中始新世地层中(距今约4600万-4300万年)发现目前所知较早的兔科化石——“洛河卢氏兔”。
6200万年前“兔祖先”的安徽模鼠兔化石(右)和5300万年前的远古道森兔化石。孙自法 摄此外,中科院古脊椎所在内蒙古约3000万年前的地层中,还采集到保存非常完整的兔子骨架化石,经鉴定为鄂尔多斯兔。距今约3400万年前,地球上曾发生过一次全球性的大降温事件,哺乳动物也受到此次大降温事件的影响,在东亚出现一次非常明显的哺乳动物替代事件,也就是降温事件后兔形类和啮齿类替代奇蹄类成为整个哺乳动物群中的优势类群。因此,对这一时期发现的兔形类化石的后续相关研究,将对理解这些类群如何适应气候突变、生物与环境的协同演化都有非常重要的意义。
可以说,从安徽模鼠兔起步,到远古道森兔、再到洛河卢氏兔,以及其他非常丰富的兔形类化石,这些材料使得中国拥有相对完整的兔演化的化石证据链,从而为兔子的起源演化研究作出不可替代的重要贡献。
李茜研究员展示介绍采自内蒙古地区约3000万年前一件保留出土时状态的一只兔子完整骨架化石材料。孙自法 摄中新社记者:安徽模鼠兔化石发现及深入研究,为兔子起源、鼠兔同源等关键之争划上句号后,兔子起源研究领域是否还存在未解之谜?
李茜:目前,在兔子的起源演化研究领域,其实还有较多未解之谜。
首先,安徽模鼠兔是兔类“老祖先”虽然已毫无疑问成为中外学界共识,但再往前追溯安徽模鼠兔的演化源头,这个问题现在还没有一个好的化石证据来回答,也是科学家们希望探索和解决的谜题。
其次,虽然我们找到了6200万年前的“兔祖先”安徽模鼠兔,也有众多被归入兔科中的早期属种在欧亚大陆广泛分布,但是现代兔类的祖先在很长一段时间内在欧亚大陆的记录是缺失的,在距今约800万年左右它们突然在亚洲和欧洲辐射开来,目前对这一被科学家们称为“兔事件”的过程尚无清晰的认识。这一问题还与现生兔类起源有很重要关系,因此也成为古生物学家一直探索的兔子演化的关键问题之一。
第三,兔子包含有兔科和鼠兔科,目前所发现的早期鼠兔科化石材料都非常破碎和零散,鼠兔科起源依然成谜。虽然中国已发现一类称为链兔的化石材料,但它是否为真正鼠兔科最早化石及起源还有争议,后续希望能发现更完整的化石材料来进行研究确定。
现生鼠兔科动物在中国青藏高原大量分布,它对环境特别敏感,堪称环境变化的“晴雨表”,尤其是对今天生物多样性、青藏高原环境保护等均有重要研究意义。例如新疆的伊犁鼠兔,现已列入国家二级保护动物。
李茜研究员兔年说兔,科普解读兔子起源演化的“前世今生”。孙自法 摄中新社记者:在兔子起源演化研究过程中,中国科学家与国际同行开展了哪些合作研究?有什么代表性合作成果?未来国际合作研究有何计划安排?
李茜:兔子起源演化研究中,中科院古脊椎所在20世纪70年代发现安徽模鼠兔化石之后,很快进行研究工作并将研究成果带到国际学术会议、国际合作交流当中。20世纪80年代,中国科学家在国际上提出“鼠兔同源”概念,并在国际学术会议上进行展示介绍,随即引起国际学术界尤其是研究兔形类和啮齿类专家学者的广泛关注。
在随后的进一步研究里,中国不仅对兔子起源演化开展形态学研究,也参与到通过古生物学的形态学和现代分子生物学相结合的综合研究当中。时至今日,无论是古生物的形态学研究,还是综合现代分子生物学的研究,国际学术界都已认可“鼠兔同源”概念,安徽模鼠兔是兔子的“老祖先”或者说祖先类型,也成为国际学界共识。
同时,因为在中国发现“兔祖先”化石,以及较为完整的有关兔演化的化石证据,这也吸引非常多的国际同行到中国来进行相关国际合作研究。前面提到,兔子起源演化研究领域还有很多未解之谜,在破解这些谜题的时候,中国所拥有丰富的、重要的兔化石材料将更富吸引力,相信未来在这些领域会有更多国际合作的推进,产生更多的研究成果。
值此兔年到来之际,中科院古脊椎所科研团队根据安徽模鼠兔化石研究成果,对“兔祖先”形象进行科学复原并完成生态复原图,展示出6200万年前潜山盆地的生态环境面貌,并成为央视兔年春晚吉祥物“兔圆圆”的灵感来源和设计基础,我们也借此祝大家兔年新春快乐,在新的一年里“兔”飞猛进、大展宏“兔”。(完)
专家简介:
李茜,中国科学院古脊椎动物与古人类研究所(中科院古脊椎所)研究员,博士。主要从事古近纪哺乳动物及陆相地层学方面的研究。重点研究小型哺乳动物(啮齿类、兔形类等)的分类和系统学,物种的起源和演化,及哺乳动物与古环境之间的协同演化。她迄今已在国际及国内核心期刊杂志发表研究论文70余篇,取得的主要研究成果如下:
一是在中国诸多地点和层位上首次报道有关啮齿类和兔形类化石,对其中不同门类的起源和演化提出新的认识、进一步证实啮齿类的亚洲起源。二是首次建立起东亚早始新世至早渐新世啮齿类化石的连续演替序列,该序列明显反映出啮齿类对同期全球气候、环境变化的响应;该序列也成为中国及东亚不同地区地层划分和对比的重要参照。三是推进并解决亚洲哺乳动物分期与北美及国际分期之间对比的问题,建立有年龄标定的古近纪地层框架,为中国陆相地层建阶提供有力支持。
中国网客户端 国家重点新闻网站,9语种权威发布 |