ChatGPT重磅升级:可以看图、说话,几秒钟制作出逼真的合成语音!

释放双眼,带上耳机,听听看~!
用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。例如,让ChatGPT听一段小猫咪的文本...

近日,人工智能技术公司OpenAI宣布将在接下来的两周内,向其大型语言模型ChatGPT中推出语音和图像功能。这一消息引起了广泛关注,因为这意味着用户将可以通过语音和图像与ChatGPT进行更自然、更便捷的交流。

根据OpenAI的介绍,新的语音功能将允许用户通过说出自己的问题,将文本转换为音频,然后生成答案,再将答案转换为音频,播放给用户。例如,用户可以让ChatGPT听一段小猫咪的文本故事,然后选择人类语音便可以一键完成转录。完成后,用户可以下载这段语音。

图像输入功能则类似于Google Lens,用户可以拍摄自己感兴趣的事物,并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。

OpenAI表示,这项新的语音技术能够从几秒钟的真实语音中制作出逼真的合成语音,为许多有创意和无障碍的应用打开了大门。然而,这些功能也带来了新的风险,例如恶意行为者可能冒充公众人物或实施欺诈。OpenAI表示,这种模型不会被广泛开放,而是会受到严格的控制和限制。

此外,OpenAI还放出了一段视频,是和ChatGPT商量着修自行车,不断问 ChatGPT:这里是扳手吗?是调整这里吗?甚至还把说明书拍照发给ChatGPT求解释。

随着人工智能技术的不断发展,越来越多的企业和机构开始关注AI相关板块。据中国基金报分析称,Chatgpt即将开放图生文及语音对话功能,AI技术持续迭代再翻新一页。在二级市场上,近期AI板块的走强,离不开行业利好的刺激。7月13日,网信办等七部门联合公布《生成式人工智能服务管理暂行办法》。8月31日起,百度文心一言、讯飞星火等大模型正式向公众开放。9月5日,WPS AI正式面向社会开放,率先应用在WPS智能文档。9月21日,微软举行了秋季发布会,在发布会上微软宣布将于本月26日发布Windows 11的下一个大更新23H2。

国盛证券认为,Copilot发布进度超预期,AI办公的扩展速度及价值空间均远超预期。同时,国内AIGC监管已走上正轨、软件应用价值亟待释放。天风证券表示,看好光模块为AI最强板块:光模块板块基本面一直以来利好不断。2024年800G预期大规模放量至千万只级别,海外、国内400G需求不断上调至800G同等规模。2025年800G需求持续且1.6T时代开启,光模块景气持续3年,供应格局没有变化。

总之,随着人工智能技术的不断发展和应用场景的拓展,AI相关板块有望迎来更多的投资机会。如果您有这方面的需求,可以联系我们的客服顾问微信:yunyingquan888。



免费交流群:领运营干货,拓展人脉资源,进群备注“进群”,客服微信yunyingquan888

版权声明:除特别注明,本站所有文章均为原创,如需转载请与我们联系。如特别标明作者,版权(文章、图片、视频等)均归作者所有,本平台仅提供信息存储服务,如若转载请联系原作者。

给TA赞赏
共{{data.count}}人
人已赞赏
AI工具

ChatGPT,安全生产领域怎么用?

2023-10-7 16:41:36

AI工具

如何利用chatgpt学习新的技能

2023-10-7 17:42:27

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索