OpenAI语音转录器具被曝严重幻觉:转录100小时,一半儿在瞎说

你的位置:宁夏清倍商贸有限公司 > 新闻动态 > OpenAI语音转录器具被曝严重幻觉:转录100小时,一半儿在瞎说
OpenAI语音转录器具被曝严重幻觉:转录100小时,一半儿在瞎说
发布日期:2024-11-01 18:52    点击次数:165

OpenAI语音转录器具被曝严重幻觉:转录100小时,一半儿在瞎说

西风 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI的AI语音转写器具,阿谁堪称近乎“东说念主类水平”的Whisper,被曝幻觉严重——

100多小时转录,被工程师发现约一半王人在瞎说。

更严重的是,好意思联社还爆料有医疗机构愚弄Whisper来转录医师与患者的诊断,瞬息激发多数网友矜恤。

据悉,明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的卓绝30000名临床医师和40个卫生系统已初始使用法国AI和洽公司Nabla基于Whisper打造的器具。

况且他们还是转录了粗略700万次医疗就诊。

网友纷纷暗示这就有点吓东说念主了。

值得一提的是,OpenAI之前早就告诫过,该器具不应在“高风险领域”中使用。

针对最新爆料,有OpenAI发言东说念主恢复,OpenAI会在模子更新中加入相应的反馈机制。

OpenAI被督促速即处治此问题

Whisper是OpenAI老早前推出的开源自动语音识别(ASR)系统,于2022年9月发布。

它摄取简便的端到端神气,基于编码器-解码器Transformer架构。输入音频将被分红30秒的块,窜改为梅尔倒谱(音频特征索要神气之一,log-Mel spectrogram),然后传入编码器。

进程68万小时的多谈话和多任务监督收集数据的磨练,Whisper不错进行多谈话转录。

Whisper推出后得回平庸应用,如今GitHub已揽获70.2k标星:

据悉,它还被集成在ChatGPT的一些版块中,同期亦然Oracle和微软云策动平台的一项内置处事,而这些平台为巨匠数千家公司提供处事。

此外,仅在上个月,HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi暗示,Whisper是最受迎接的开源语音识别模子。

而现时,据好意思联社报说念,许多决议东说念主员和工程师反馈,在职责中他们时时遭逢Whisper产生的幻觉。

举例,密歇根大学的一位决议员在尝试校阅模子之前,发现其查验的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出,在他分析的卓绝100小时Whisper转录中,约莫一半出现了幻觉。

还有一位建树者暗示,在他使用Whisper创建的26,000份转录中,险些每一份王人发现了幻觉。

……

这种问题甚而存在于录制细密的短音频样本中。

在最近的一项决议中,策动机科学家们在审查的卓绝13000个澄莹音频片断中发现了187个幻觉。

工程师和决议东说念主员暗示,他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。

Whisper幻觉严重的原因现时尚未可知,但有软件建树者暗示,这些造谣推行时时发生在停顿、有布景声息或音乐播放时。

之前,OpenAI就有教导:

不要在决策情境中使用Whisper,准确性上的弱势可能导致成果出现赫然偏差。

然鹅,好意思联社暗示,这一告诫并未辞让一些病院或医疗中心使用Whisper等语音转笔墨模子——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内,还是有超30000名临床医师和40个医疗系统还是初始使用由Nabla公司基于Whisper建树的器具。

Nabla CTO Martin Raison称,该器具针对医疗谈话对模子进行了微调,用于转录和雅致患者的调换。

现时,该器具已被用于转录约700万次医疗就诊。

在得知Whisper可能会产生幻觉后,Nabla暗示正在处治此问题,不外:

由于“数据安全原因”,Nabla的器具会删除原始音频,无法将Nabla生成的AI文本与原始灌音进行比拟。

此外,据了解,Whisper还被用来为聋东说念主和听力贫瘠者创建字幕。

Whisper幻觉严重问题被发现后,有东说念主敦促OpenAI速即处治此问题。

本年2月离开OpenAI的决议员William Saunders也开麦了:

如若公司称心优先推敲,这似乎是不错处治的。如若你把它放出去,东说念主们过于自信于它的功能,并将其集成到通盘这些其他系统中,那就成了问题。

有OpenAI发言东说念主恢复称,公司握续决议奈何减少幻觉表象,并感谢决议东说念主员的发现,同期补充说念OpenAI会在模子更新中融入相应反馈机制。

参考持续:[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858

— 完 —

量子位 QbitAI · 头条号签约

矜恤咱们,第一工夫获知前沿科技动态