AI助盲 打开视障人士新视野
科技日报 2020-12-14 15:56

重见光明,对于全球5000多万盲人来说,是一个遥不可及的梦想,而能够让盲人在黑暗的世界里具有更多的独立性,现代日新月异的科技,特别是人工智能技术正在给予助力,有望实现。

不久前,谷歌正在测试一种人工智能系统,帮助盲人和有视力障碍的人独立跑步。那么,这个人工智能系统基于哪些技术如何让视障人士参加跑步比赛;近年来在帮助视障人士恢复视力等方面,人工智能现阶段有哪些阶段性成果;目前这些产品距离应用还有多远,是什么因素限制其推广普及?

奔跑吧,让AI来做你的“眼睛”

现在很多崇尚健身的人喜欢挑战马拉松,而盲人如何参与跑完“半马”或“全马”呢?据一位相关公益组织的人介绍,这需要组织陪跑者帮助他们。为了方便跑步,盲人和陪跑者之间有条牵引绳,各自一头套在自己手腕上,如同牵手跑步。为了万无一失,有时需要两位陪跑者。但是,盲人平时训练时,随时找个陪跑者似乎不太现实。

最近,不少城市的公共交通开始逐步接纳导盲犬。然而,国内导盲犬的数量十分有限,据统计,截至2017年,数量仅为116只,比大熊猫还稀少,而需要导盲犬服务的盲人却多达800万人左右。每一只导盲犬需要耗费12万到15万元,寿命也只有十几年,即使有幸排到一只,当它退役之后,视障者又该如何外出,这是个值得思索的问题。

“谷歌开发的这个系统,不需要让盲人依靠人类向导或导盲犬即可自己跑完全程。而研发给予帮助的公司旨在‘作盲人的眼’,创始人是一位热爱跑步的人。”远望智库AI事业部部长、图灵机器人首席战略官谭茗洲介绍说。     

据介绍,这个应用程序使用人工智能模型来识别道路上的一条画线,并推断出跑步者与这条线的关系。如果跑步者开始离线太远,该应用程序就会向他们佩戴的骨导耳机发送信号,播放令人不快的噪音。声音是哪只耳朵发出的、音量有多大,都能让跑步者知道他们需要移动的方向及其离终点有多远。

谭茗洲解释道,“这有点像汽车上使用的接近警报,当汽车离可能发生碰撞的地方越近,警报的声音就会越大,频率也会越快。使用谷歌的这个系统,跑步者需要把一部安卓手机与经设计的腰带绑在腰上。”

据说,这款应用程序不需要连接互联网即可工作,而且还可考虑多种光照和天气条件。显然,若在一些社区,专门为盲人建立带有指引标志的赛道,他们自己可以安心愉快地奔跑健身。

构建“无障碍”场景,让黑暗世界重现光明

“盲人只是眼睛看不见,不过声音还是可以听到的,以目前的科技真正让他们看见世界不太可能,但可以让他们体验到‘如同看见’的效果。”谭茗洲指出。

如今,在不同程度上,许多互联网公司都成功让盲人得以与它们的服务互动,主要方法就是将文本转变成由屏幕阅读器发出的语音。四年前,脸谱发起“无障碍倡议”,尝试采用人工智能技术来丰富盲人、聋人和其他残疾人士的用户体验,重点工作之一是重新设计菜单和按钮结构,运用自动口译某些照片和视频的算法使其能为屏幕阅读器所用,为盲人用户提供前所未有的场景描述。

作为美国一位专业徒步旅行者,盲人特雷弗·托马斯时不时在脸谱上与粉丝分享其经常带着爱犬到一些山径和步道徒步旅行的照片和视频。他感慨道,“之前因看不见照片,我对是否使用脸谱无所谓,而现在我无法想象没有脸谱的日子了。”  

例如,对于旧金山湾落日的照片,运用人工智能技术的屏幕阅读器如此描述:这张照片含有“自然、户外、云朵、草地、地平线、植物或树木”;一对夫妇带着孩子站在加州丹麦城著名风车前面的照片,屏幕阅读器诠释:这张照片包括了“3个人,微笑,户外”。   

“显然,这些解释不能对照片进行全面描述,但在没有人工帮助的前提下确实填补某些空白,盲人仅需点击阅读器来描述,而无须他人来做解释。”谭茗洲说。

瑞士eyra公司专门为盲人研发一种助读设备。据介绍,这个装置由三部分组成:挂在耳朵上面的骨传导耳机及其上面的高清摄像头,还有AI智能处理器。AI处理器可以将文字上的文本转化成有声小说,当然也不用担心噪音干扰的问题,因为是骨传导,可以一定程度上减少噪音干扰,给盲人们的生活带来便利。

今年在拉斯维加斯举办的世界最大消费类电子产品展会上,一款智能手机可以通过语音讲述周围的世界,赋予盲人和弱视用户独立自主的能力。该应用还适用于智能眼镜,可将用户的智能手机摄像头变成用户的眼睛。据介绍,其利用人工智能识别摄像头指向的视觉信息,包括食品包装、海报和显示屏,比如超市的商品信息、车站的显示投屏、街边的海报。此外,还可以识别记录亲朋好友的面孔,用户可以用其扫描和寻找周围的人和事,如同让黑暗的世界重现光明。

加速突破性运用,冰冷科技释放人文关怀

据悉,我国约有1200万视力障碍者,但受教育者人数仅6万,作为重要知识来源的书籍对盲人而言几乎是“奢侈品”。据美国劳工部和美国盲人联盟的统计资料表明,目前盲人可以顺利就业的职业达147种,因此,有学者提出,要想改变我国盲人的就业现状,教育是关键一步,特殊教育也必须科技化。

目前,很多专为视障人士设计的解决方案,凸显人工智能应用的日益强大和多样化,人性化的考量,也让人工智能更显实用与温暖。那么,如何加速人工智能产品的突破性运用,让冰冷科技释放出人文关怀?      

谭茗洲指出,这需要三方面发力。首先要培育创新生态。记得曾在2017年德勤全国创新精英挑战赛总决赛上,一支四川大学在校学生团队研发的一款盲人Kindle阅读器获奖。我们应该激励更多像这样为视障人士创新的技术成果,不让其沉睡,尽早转化成真正让盲人受益的产品。这就需要构建一个良好的创新生态。

再有,要解决算力和成本之间的矛盾。机器学习训练往往要消耗大量的算力,操作中会出现时间上的延迟与信息隐私的安全隐患,这就要将AI算法中的数据上传到云端完成。而要满足终端AI推理运算的实时、可用性需求,就要在本地处理大量的数据,由此,若在终端本身部署高性能的AI芯片,从成本控制上来看不大现实,那么若在实体场景中部署足够多的边缘AI倒是有一定可行性。边缘计算可看作是5G+AI+云计算的绝佳辅助——“神经末梢”。比如AI导盲杖要实现实时交互与判断,看到红绿灯变绿,自动能够判断出“可通行”。这样不必将路灯信息上传到云端,经云服务器层层判断才发出行走的提醒。无疑大大减少延迟带来的行进风险,也降低云端计算的超负荷。

再有,需要等待产业环境的全面成熟:基础设施的完善,软硬件基本到位,这样可在终端设备上更好运行深度学习功能;加强5G智能网络,保障云计算及边缘计算的每一个节点高效可靠利用。而当产业应用联动,协同合作,通过技术的整合将会发挥出AI的最大价值,打开视障人士的新视野。

文/科技日报记者 华凌

编辑/范辉

最新评论