公众号
当前位置:栏目>>文章详情

AI个人助理,Siri和Alexa们的升级将超乎你想象!

来源:汽车商业评论(孟为)23年5月10日 14:30

撰文 / 孟 为
编辑 / 张 南
设计 / 琚 佳
来源 / Bloomberg

在复仇者联盟的超级英雄宇宙中,钢铁侠托尼·斯塔克为自己打造了一个人工智能管家贾维斯(Just A Rather Very Intelligent System),帮助他管理企业,提供安全保障,并协助其他复仇者联盟成员打击邪恶。

在人类的现实宇宙中,新一代的人工智能产品也正在试图扮演类似的角色,组织和尽可能帮助人们的工作和生活。

按照设想,这些为大众服务的贾维斯产品与以前的数字助理相去甚远,后者仅仅会做一些基本的任务,如设置提醒和整理购物清单。

像苹果公司的Siri、谷歌的谷歌助理和亚马逊公司的Alexa目前都无法与现代大型语言模型系统(如ChatGPT)的能力相提并论,后者能够为查询提供复杂的答案并执行复杂的计算机任务。

这让Siri、Alexa这些语音助手正在面临着和空前的压力。

在此基础上,互联网公司现在的新竞赛是建立超级定制化的个人助理。

谷歌在班加罗尔的人工智能研究实验室负责人马尼什·古普塔(Manish Gupta)说,“智能个人助理的梦想比我们想象的更接近现实”。

在不久的将来,由LLM(大型语言模型)驱动的智能助理将计划你的整个假期,而不是再根据你提出的航班要求、预订酒店信息,以及选择餐饮等每一个增量进行步骤式的指示操作。

目前众多的初创公司也正在抓住这个机会,推出一系列人工智能的助手产品。比如,由Inflection AI打造Pi智能产品,被认为是一个中立的倾听者,帮助人们感受到倾听和陪伴。BeMyEyes是一个针对视力障碍者的个人助理。来自初创公司OthersideAI的智能助理,可以监控收件箱中的特定发件人,并在电子邮件到达时作出回应。

不久前,微软甚至推出了和贾维斯同名的AI项目。

这个AI模型名称为HuggingGPT的创新人工智能系统,在自然语言处理(NLP)和计算机视觉(CV)领域受到了极大的关注。它是一个集成了大型语言模型(LLM)和专家模型的框架,用于处理任何模式或领域中的复杂任务。

HuggingGPT由四个阶段组成:任务规划、模型选择、任务执行和响应生成。

在任务规划阶段,大型语言模型(LLM)解析用户请求,将其分解为多个任务,并根据其知识规划任务顺序和依赖关系。

在模型选择阶段,LLM根据HuggingFace中的模型描述,将解析后的任务分配给专家模型。

在任务执行阶段,专家模型在推理端点上执行分配的任务,并将执行信息和推理结果记录到LLM。

最后,在响应生成阶段,LLM总结执行过程日志和推理结果,并将摘要返回给用户。此工作流允许HuggingGPT处理任何模式或域中的复杂任务,使其成为各种应用程序的通用工具。

无论是HuggingGPT,还是ChatGPT,它们的目标都是希望像钢铁侠的贾维斯所展示的那样,打造一个好的助手,知道什么时候应该主动出击,学会如何在不需要人们细致入微的指令去解决问题。

亚马逊首席执行官安迪·贾西最近也暗示,他的公司打算让Alexa成为终极个人助理。这需要在目前的基础上进行大的升级,并将面临来自谷歌、Meta Platforms Inc.、微软和OpenAI的激烈竞争。

尽管关于人工智能在敏感个人信息披露、道德伦理上还有很多的问题需要解决,但毫无疑问地是,全世界的公司都在争先恐后地试图将钢铁侠的贾维克变为现实。

本文由汽车商业评论原创出品

转载或内容合作请联系说明

违规转载必究