OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在瞎说

栏目分类

新闻动态: 公司简介; 联系我们; 产品中心; 新闻动态

热点资讯

南京二手房库存跌破15万套关隘议价空间收窄0.7%，房东报价

枣林湾找“宁”玩

“11元拍到海景房”

你的位置：宁夏清倍商贸有限公司 > 新闻动态 > OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在瞎说

OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在瞎说

发布日期：2024-11-01 18:52 点击次数：165

OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在瞎说

西风发自凹非寺

量子位 | 公众号 QbitAI

OpenAI的AI语音转写器具，阿谁堪称近乎“东说念主类水平”的Whisper，被曝幻觉严重——

100多小时转录，被工程师发现约一半王人在瞎说。

更严重的是，好意思联社还爆料有医疗机构愚弄Whisper来转录医师与患者的诊断，瞬息激发多数网友矜恤。

据悉，明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的卓绝30000名临床医师和40个卫生系统已初始使用法国AI和洽公司Nabla基于Whisper打造的器具。

况且他们还是转录了粗略700万次医疗就诊。

网友纷纷暗示这就有点吓东说念主了。

值得一提的是，OpenAI之前早就告诫过，该器具不应在“高风险领域”中使用。

针对最新爆料，有OpenAI发言东说念主恢复，OpenAI会在模子更新中加入相应的反馈机制。

OpenAI被督促速即处治此问题

Whisper是OpenAI老早前推出的开源自动语音识别（ASR）系统，于2022年9月发布。

它摄取简便的端到端神气，基于编码器-解码器Transformer架构。输入音频将被分红30秒的块，窜改为梅尔倒谱（音频特征索要神气之一，log-Mel spectrogram），然后传入编码器。

进程68万小时的多谈话和多任务监督收集数据的磨练，Whisper不错进行多谈话转录。

Whisper推出后得回平庸应用，如今GitHub已揽获70.2k标星：

据悉，它还被集成在ChatGPT的一些版块中，同期亦然Oracle和微软云策动平台的一项内置处事，而这些平台为巨匠数千家公司提供处事。

此外，仅在上个月，HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi暗示，Whisper是最受迎接的开源语音识别模子。

而现时，据好意思联社报说念，许多决议东说念主员和工程师反馈，在职责中他们时时遭逢Whisper产生的幻觉。

举例，密歇根大学的一位决议员在尝试校阅模子之前，发现其查验的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出，在他分析的卓绝100小时Whisper转录中，约莫一半出现了幻觉。

还有一位建树者暗示，在他使用Whisper创建的26,000份转录中，险些每一份王人发现了幻觉。

……

这种问题甚而存在于录制细密的短音频样本中。

在最近的一项决议中，策动机科学家们在审查的卓绝13000个澄莹音频片断中发现了187个幻觉。

工程师和决议东说念主员暗示，他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。

Whisper幻觉严重的原因现时尚未可知，但有软件建树者暗示，这些造谣推行时时发生在停顿、有布景声息或音乐播放时。

之前，OpenAI就有教导：

不要在决策情境中使用Whisper，准确性上的弱势可能导致成果出现赫然偏差。

然鹅，好意思联社暗示，这一告诫并未辞让一些病院或医疗中心使用Whisper等语音转笔墨模子——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内，还是有超30000名临床医师和40个医疗系统还是初始使用由Nabla公司基于Whisper建树的器具。

Nabla CTO Martin Raison称，该器具针对医疗谈话对模子进行了微调，用于转录和雅致患者的调换。

现时，该器具已被用于转录约700万次医疗就诊。

在得知Whisper可能会产生幻觉后，Nabla暗示正在处治此问题，不外：

由于“数据安全原因”，Nabla的器具会删除原始音频，无法将Nabla生成的AI文本与原始灌音进行比拟。

此外，据了解，Whisper还被用来为聋东说念主和听力贫瘠者创建字幕。

Whisper幻觉严重问题被发现后，有东说念主敦促OpenAI速即处治此问题。

本年2月离开OpenAI的决议员William Saunders也开麦了：

如若公司称心优先推敲，这似乎是不错处治的。如若你把它放出去，东说念主们过于自信于它的功能，并将其集成到通盘这些其他系统中，那就成了问题。

有OpenAI发言东说念主恢复称，公司握续决议奈何减少幻觉表象，并感谢决议东说念主员的发现，同期补充说念OpenAI会在模子更新中融入相应反馈机制。

参考持续：[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858

— 完 —

量子位 QbitAI · 头条号签约

矜恤咱们，第一工夫获知前沿科技动态

上一篇：国产260马力智能电动粗率机问世

下一篇：今天才知谈，买猪蹄切记不可专挑大的捡！铭记3句顺溜溜，好猪蹄一挑一个准