美国要闻

重磅宣布!ChatGPT升级可看图、听声音、说话…

来源:未知 阅读: 2023-09-27 23:35 我要评论





OpenAI宣布ChatGPT功能将超出文字之外。(美联社)



生成式人工智能(AI)系统ChatGPT开发商OpenAI公司25日宣布,将新增语音及影像识别功能,让ChatGPT“能看见、能听到、能说话”,解决更多生活或工作的疑难杂症,预计未来两周内就会上线。

路透报导,目前的ChatGPT虽然生成内容强大,但仅止于以文字和用户字交流,增添语音功能后,将能够读懂用户的谈话,并透过语音回答,代表ChatGPT会变得愈来愈像苹果(Apple)装置内建的Siri,或是亚马逊(Amazon)推出的Alexa等。

OpenAI在声明中表示,新的语音功能不但能回答用户的问题,还能进行对话,也可以要求ChatGPT在就寝时为家人说段睡前故事,或解决餐桌上的争论。

至于影像识别,目前最强大的是Google Lens装置,提供以图搜图、图像上面的文字翻译等,但ChatGPT的功能可能会更进一步,例如旅行时拍下一张地标的照片,就能即时讨论当中有趣之处,或者拍下冰箱内部的照片就可取得餐点食谱的建议,还可以拍下孩子的数学作业照照片,就能帮忙解答问题。

OpenAI表示,预计未来两周,付费版本就会具有新的语音及图像识别功能。

(来源: 上报)

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 马里兰州政府将宣布大幅削减交通运输机构

    马里兰州政府将宣布大幅削减交通运输机构

    2023-12-08 09:10

  • 美国航空业再迎大震动,阿拉斯加航空宣布收购夏威夷航空

    美国航空业再迎大震动,阿拉斯加航空宣布收购夏威夷航空

    2023-12-07 20:54

  • 美国国税局宣布推迟2023年第三方平台付款的1099-K表格申报门槛;

    美国国税局宣布推迟2023年第三方平台付款的1099-K表格申报门槛;

    2023-11-26 00:30

  • 美国国税局宣布推迟2023年第三方平台付款的1099-K表格申报门槛;

    美国国税局宣布推迟2023年第三方平台付款的1099-K表格申报门槛;

    2023-11-26 00:28

网友点评