向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
抢夺夜间市场,咖啡馆琢磨起“日咖夜酒”******
“我也在考虑将自己的咖啡馆转成‘日咖夜酒’,增加点收入,也能延长营业时间。”在北京经营咖啡馆的小仲最近看到一些咖啡馆上架了酒精类的产品,有了拓展咖啡馆业务的想法。
咖啡在中国市场越来越普及,越来越多的咖啡品牌走进消费者视野。随着“日咖夜酒”的模式在众多咖啡馆兴起,咖啡与酒这两个原本边界明确的品类,如今出现在同一家店铺中。
业内人士认为,从咖啡品牌来讲,增加了经营品类可以吸引到更多的消费群体,除去音乐与灯光,咖啡馆本身与酒吧的环境类似,这让咖啡馆转向“日咖夜酒”模式更为轻松。但另一方面,咖啡馆做酒精类产品,要考虑供应链问题,选址还有一定要求,员工培训也是一方面支出。
众多品牌布局
邮局咖啡全国首家“日咖夜酒”概念店2022年11月在福建福州青年会开业。该店在“日咖夜酒”的全新模式下,白天与黑夜衔接,咖啡厅与酒吧切换。
所谓“日咖夜酒”,就是同一家店白天卖咖啡,晚上卖酒。这一概念逐渐被年轻消费者引申为“早C晚A”,即“早coffee(咖啡)晚alcohol(酒)”。虽然咖啡馆与酒吧表面上看起来是毫无联系的两个业态,但两者的消费群体却有一定的重合,这些消费者喜欢白天喝咖啡提神,下班后喝点酒,希望能睡得香。
邮局咖啡并非首家布局“日咖夜酒”的咖啡品牌。2022年10月,加拿大咖啡品牌Tims天好咖啡在中国市场开出了两家“日咖夜酒”专门店,采用“日咖夜酒”模式,每天下午5时之后供应啤酒、小食等产品,有果酒、小麦等31款啤酒可供选择。
新茶饮品牌茶颜悦色推出的鸳央咖啡也宣布在所有门店上线“鸳央夜酒系列”,只可进行堂食点单。新京报记者登录鸳央咖啡小程序看到,点单页面显著标注着“未成年人禁止饮酒”,在酒精产品类别,有夜间特别推荐、酒坊、夜酒几个栏目,各类产品均为配制酒,售价在17.8元-19.8元。
星巴克早已在其臻选门店尝试出售酒精类产品。2020年8月,作为星巴克在中国内地的首家旗舰店,北京三里屯太古里旗舰店升级成为臻选店。在该门店二层增加了特调酒坊,可为消费者提供超过30款创意特调鸡尾酒、葡萄酒和精酿啤酒。
对咖啡品牌来讲,增加酒精类产品,希望提升门店坪效,延长营业时间。上海啡越投资管理有限公司董事长王振东认为,“日咖夜酒”并不是新概念,这种模式在日韩以及欧洲一些国家都有尝试,那里的咖啡店和酒吧本身没有分得那么清楚。“咖啡比较重要的是提神的效果,如果喝多了或者喝得比较晚,容易造成失眠。因此,一般咖啡的消费都是在下午四点之前,之后的购买量就很少了。因此,对咖啡店来讲,六点以后也想有生意可以做,选择酒就顺理成章。”
新业态的探索
在中国市场,随着年轻消费群体的崛起,咖啡与鸡尾酒的消费逐渐盛行,咖啡赛道已经涌入了众多玩家。如何脱颖而出,是当下各个品牌的思考题。
作为最近两年快速兴起的生活方式,“日咖夜酒”模式受到年轻消费群体的喜爱。根据《2020-2021轻人群酒水消费研究报告》和《咖啡行业细分人群洞察》显示,90后、95后以及Z世代人群同为国内酒水和咖啡的主流消费叠加群体,已成为“日咖夜酒”消费的主力军。报告指出,在消费偏好上,年轻群体更偏向低度数果酒和啤酒,健康微醺是当下重要的关键词之一。
对于为何涉足“日咖夜酒”,不同品牌有着各自的考虑。Tims咖啡表示,希望通过探索更多消费场景和业态,为消费者带来更加多元的沉浸式体验。
有的品牌则会考虑到消费群体的拓展。鸳央咖啡相关负责人告诉新京报记者,相较于之前的日咖模式,到了晚上,顾客考虑到咖啡因的影响,销量会降低,夜酒系列上线丰富了产品结构,吸引到部分消费者晚间来尝试鸳央咖啡的中式鸡尾酒。
小仲的咖啡馆位于北京鼓楼附近,这里时常有游客光顾,咖啡馆也积累了不少忠实粉丝。受疫情影响,咖啡馆收入相较于往年低了,这让小仲思考转变。“我认识一些同行,他们顺利地转成了‘日咖夜酒’,延长了营业时间,也让门店更具特色,吸引更多消费者前来打卡。”
王振东认为,现在年轻人,对于酒吧的消费与从前不同。“以前年轻人喜欢去类似俱乐部的酒吧,可以跳舞与社交的地方。但是这些年越来越多的消费者喜欢到静吧消费,不一定要喝威士忌等烈酒,喝喝精酿,简单的鸡尾酒,与朋友聊聊天就很开心。所以咖啡店面积不太大,相对安静,比较适合做夜酒产品。”
咖啡赛道已经升级成比拼创新的赛道,去年以来,生椰拿铁、果萃拿铁等产品一度引爆咖啡行业,如今咖啡企业做酒产品,也考虑到了特色问题。
鸳央咖啡相关负责人说,鸳央咖啡和其他的酒消费场景不太一样,比如鸳央咖啡的夜酒系列是主打中式鸡尾酒,将中国传统的黄酒、米酒、白酒和西方的伏特加、龙舌兰、金酒进行搭配;也有别于鸡尾酒得在酒吧喝的形式,“我们想做的是一杯深度饮料化的鸡尾酒,所以鸳央咖啡的鸡尾酒可以像买奶茶、咖啡一样即买即走、边走边喝。”
Tims咖啡相关负责人称,其“日咖夜酒”店不仅将咖啡门店广受好评的明星产品组合端上餐桌,而且将年轻消费群体喜爱的低度数果酒和啤酒列入菜单。消费者既可品尝Tims咖啡“咖啡+暖食”经典产品,还可小酌微醺,体验咖啡的浓香与啤酒的麦芽香气相互交融的快乐。
面临的难题
从单一咖啡到“咖啡+酒”,业绩随之增长。在鸳央咖啡看来,增加酒精产品以及营业市场,对业绩是有增量的,“夜酒系列丰富了产品品类,酒和咖啡也吸引了不同的消费者前来消费。”Tims咖啡相关负责人也称,布局“日咖夜酒”市场,不仅为年轻用户搭建起时尚、前卫生活的消费新场景,也将提升门店坪效,打造第二增长曲线。
有了盈利,这一模式能否一直走得通呢?
虽然从消费场景、消费群体上咖啡馆与酒吧有一定程度的重合,但咖啡师与调酒师却是不同的职业,咖啡馆的供应链也与酒吧不同。如何保障两个业态的同步运行,是摆在咖啡馆老板面前的难题。
王振东认为,咖啡馆与酒吧的运营要求是完全不一样的,做咖啡店的人和做酒吧的人,气质不同,对于技术的要求也不同,调酒与制作咖啡都需要对员工进行培训。比如,一个咖啡师从生手到可简单上手做,平均十天就可以了,但十天培养一个调酒师还是有难度。另一方面是产品线的差异,咖啡馆白天除了咖啡还可销售甜点,但是夜晚卖酒,甜点就不是首选,需要增加小吃。
小仲认为,咖啡馆卖酒,最难的点在于做到咖啡和酒的融合。“这两类产品除了产品本身,整体的环境风格也需要做出相应的改变。”
王振东也持相同的观点,“环境其实对于酒吧很重要,需要进行相应的灯光、桌椅的布局,顾客对于音乐也有要求。整体来看,就是运营场景的变化,这就需要做一个整体的门店规划和设计布局。”
在专业人员的培训方面,鸳央咖啡介绍,“作为初创品牌,怎样做出自己的特色是我们一直在思考的问题,我们在不断学习其他同行前辈的优秀之处。夜酒系列由现有门店伙伴制作,没有单独招聘调酒师。”
咖啡馆的选址同样也限制着其转向“日咖夜酒”的模式。大众点评发布2022咖啡潮流趋势报告显示,2022年平台咖啡搜索量较去年同比增长452%。上海、广州、成都位列独立咖啡馆开店数量前三位城市,且咖啡馆选址逐渐显现出从商场到社区里的趋势,喝一杯家门口的咖啡已逐步成为现实。
商场咖啡的布局必不可少,但对咖啡馆来讲,商场的门店很难转化成“日咖夜酒”。王振东认为,很多开在商务楼、写字楼咖啡馆未必晚上适合做酒吧,因为写字楼晚上通常关门较早,进出也不方便,商场同样存在这样的问题。另外,门店楼上有居民在居住的,也可能会接到投诉,所以并不是所有的咖啡馆都适合做“日咖夜酒”。
虽然目前“日咖夜酒”还在发展中,但涉足的品牌却相对乐观。Tims方面称,“日咖夜酒”模式尚在试验阶段,目前反响良好,未来可能会有更多的探索。鸳央咖啡称,现阶段更多是将“日咖夜酒”的模式在现有门店跑顺畅,打磨好自己的服务和品质,咖啡一杯一杯卖、服务一单一单做,这是持续努力的方向。
(文图:赵筱尘 巫邓炎)