OpenAI发布旗舰AI模型GPT-4o:能识别用户情绪,还有幽默感
标普500ETF
2024-05-14 15:46:36
来自上海
  • 点赞
  • 评论
  •   ♥  收藏
  • A
    分享到:

OpenAI周一发布了一款新的旗舰生成式AI模型“GPT-4o”,其中的“o”代表“omni”(全能),指的是该模型处理文本、语音和视频的能力。它具有与人类相似的对话能力,令人印象深刻。

GPT-4o在保持GPT-4级别的智能的同时,对文本、视觉和音频功能进行了改进。OpenAI首席技术官(CTO)Mira Murati及其员工Mark Chen和Barret Zoph在现场演示时展示了新的音频对话和视觉理解能力。

OpenAI声称,GPT-4o对音频输入的平均反应时间约为320毫秒。根据2009年的一项研究,这与人类在对话中的反应时间相似,而之前的模型通常要延迟2-3秒时间。

除了响应速度,GPT-4o似乎很容易捕捉到情绪,并根据用户的要求调整语气和风格,甚至还在回应中加入了音效、笑声和歌声。

GPT-4o更像人类

GPT-4o在理解人类交流方面迈出了重要的一步,用户可以用一种接近自然的方式与其交谈。它伴随着现实世界中几乎所有的倾向,比如打断、理解语气,甚至意识到自己犯了一个错误。

在第一次现场演示中,主持人要求GPT-4o对他的呼吸技巧做出反馈。他对着手机深深地吸了一口气,而ChatGPT则诙谐地回应道:“你不是吸尘器。”它建议使用一种速度较慢的技术,展示其理解和回应人类细微差别的能力。

除了具有幽默感,ChatGPT也会改变回应的语气,在传达“思想”的同时用不同的语调来完成。就像人类对话一样,你可以打断它的对话并纠正它,让它做出反应或停止说话。你甚至可以要求它以某种语气、风格或机器人的声音来说话。

此外,它甚至还可以提供翻译服务。在现场演示中,舞台上的两名演讲者,一名说英语,一名说意大利语,通过Chat GPT-4o的翻译进行对话。它可以快速将意大利语翻译成英语,然后无缝地将英语回复翻译回意大利语。

据悉,Chat GPT-4o在50多种语言的速度和质量上都有所提高。OpenAI表示,这些语言覆盖了世界97%的人口。

除了语音理解,Chat GPT-4o还可以理解视觉效果。例如,对于视频中的一道方程题,它可以指导你如何求解。

另外,它还可以观看现场自拍,并提供描述,包括你的穿着,以及情绪。在演示中,Chat GPT-4o表示,主持人看起来很开心。

在整个演示过程中,Chat GPT-4o工作得很快,在理解方面并不费力,也没有提出询问。与输入查询相比,与Chat GPT-4o的交流更自然。你可以自然地对着手机说话,并得到想要的回应,而不是用 谷歌 去搜索。

电影《Her》中的萨曼莎

此时,如果想到了《Her》(一部和AI虚拟人萨曼莎谈恋爱的电影),或者其他与AI相关的未来主义反乌托邦电影,你不是唯一的一个。以如此自然的方式与Chat GPT-4o交谈,本质上就是OpenAI的《Her》时刻。考虑到它将在移动应用程序和桌面应用程序上免费推出,许多人可能很快就会拥有自己的《Her》时刻。

虽然并未在直播演示中现身,但OpenAI CEO 萨姆·奥特曼(Sam Altman)对这次演示做了重要的总结,称GPT-4o给人的感觉就像电影中的AI。

他说:“新的语音和视频模型GPT-4o是我用过的最好的计算机界面,这感觉就像电影中的AI。而且,对我来说,它真实的仍然有点令人惊讶,达到了人类级别的响应速度和表现。最初的ChatGPT显示出了语言界面的可能性,但GPT-4o这个新事物感觉本质上有所不同,它快速、智能、有趣、自然、实用。”

“对我来说,与电脑交谈从来都不是很自然的感觉;但现不同了,它变得自然了。随着将来不断地完善,我真的看到了一个令人兴奋的未来,我们能使用计算机做比以往任何时候都多的事情。”

奥特曼还称,在创建OpenAI时,最初的想法是创造AI,并用它来为世界创造各种裨益。但如今,创造AI后,希望让其他人使用它来创造各种令人惊叹的东西,所有人都会从中受益。奥特曼还表示:“OpenAI是一家企业,会找到很多收费的东西,这将帮助我们为数十亿人提供免费的、出色的AI服务。”

新的安全风险

这场令人印象深刻的语音和视觉演示,可能只是触及了Chat GPT-4o各种可能性的皮毛。尽管其总体性能,以及在各种环境中的日常表现仍有待观察,但很明显,通过现场演示可以看出,Chat GPT-4o已经对谷歌和 苹果 的未来挑战做好了准备。

OpenAI称:“Chat GPT-4o是我们第一个结合了上述所有技术的模型,我们目前只是触及到探索该模型的功能,及其局限性的皮毛。”

Murati承认,Chat GPT-4o的实时音频和图像能力在安全方面带来了新的挑战。她表示,OpenAI将继续研究安全性,并在未来几周的迭代部署期间征求测试用户的反馈。

OpenAI称:“Chat GPT-4o还与社会心理学、偏见和公平性等领域的70多名外部专家进行了广泛的合作,以识别新模型可能导致或放大的风险。我们利用这些经验来加强安全干预措施,以提高与Chat GPT-4o交互的安全性。一旦新的风险被发现,我们将采取措施降低它们。”

GPT-4o前景展望

在Google I/O大会开始的前一天,OpenAI发布了Chat GPT-4o,让我们见识到了人们想要的真正实用的AI体验。如果传闻中的与苹果的合作成为现实,那么Siri将如虎添翼。

对于谷歌而言,几乎可以肯定的是,将在5月14日的I/O大会上展示其最新的AI技术。它能足以抵抗Chat GPT-4o吗?

在不到30分钟的演讲中,OpenAI无法对Chat GPT-4o进行更多的现场演示。幸运的是,它将在未来一周向用户推出,且不需要支付费用。

by 新浪

如何一键布局美股?

博时标普500ETF(513500)是国内跟踪美国标普500指数的ETF产品。通过ETF这一具有低廉管理成本、高效申赎交易模式的投资工具,帮助国内投资人捕捉美股成长收益。也可以选择博时标普500ETF联接基金(A:050025,C:006075)。美国标普500指数是国际市场公认的美股风向标,覆盖美国11个行业503家代表性上市公司,集中在市场的大盘股,约占美国股票市场总市值的80%。

费率端来看,该基金的管理费率为0.60%,托管费率为0.25%。截至2024年4月25日,作为两市规模最大的标普500ETF(513500) 基金最新份额达72.33亿份,最新规模超122亿元,场外投资者也可以选择博时标普500ETF联接(A类:050025;C类:006075)进行定投或逢跌分批布局。

博时纳斯达克100ETF(513390)是国内跟踪美国纳斯达克100指数的产品。根据纳斯达克指数官网数据,在行业分布方面,信息技术行业是指数的主要组成部分,此外,在消费服务、消费品、医疗保健等行业均有分布。从指数前十大个股来看,均为优质的高科技型企业。

费率端来看,该基金的管理费率为0.50%,托管费率为0.15%,是同类产品中费率较低的。场外投资者也可以选择博时纳斯达克100指数(A类:016055;C类:016057)进行定投或逢跌分批布局。

$标普500ETF(SH513500)$$纳指100ETF(SH513390)$$微软(NASDAQ|MSFT)$

#AI产业链走强,新一轮上攻开启?#

#美国散户大战华尔街空头再度上演?#

#美股中国资产大涨,A股稳了?#

#英伟达连续大涨,A股AI行情要来了?#

风险提示:以上数据来源均为公开信息,仅供参考,不构成任何操作建议或推荐。基金投资需谨慎。基金管理人承诺将本着诚信严谨的原则,勤勉尽责地管理基金资产,但并不保证基金一定盈利,也不保证最低收益。基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。投资者在投资基金前,请务必认真阅读《基金合同》及《招募说明书》等法律文件。本基金适当性风险等级为R3,在代销机构申购的应以代销机构的风险评级规则为准。如需购买本基金,请您关注投资者适当性管理相关规定,提前做好风险测评、并根据您自身的风险承受能力购买与之相匹配的风险等级的基金产品。

免责声明:转载内容仅供读者参考,版权归原作者所有,内容为作者个人观点,不代表其任职机构立场及任何产品的投资策略。本文只提供参考并不构成任何投资及应用建议。如您认为本文对您的知识产权造成了侵害,请立即告知,我们将在第一时间处理。

(来源:标普500ETF的财富号 2024-05-14 15:46) [点击查看原文]

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500