
Deepgram推出了Nova-3 Medical,这是一种人工智能语音到文本(STT)模型,专为苛刻的医疗保健环境中的转录而设计。
Nova-3 Medical旨在与现有的临床工作流程无缝集成,旨在满足英国公共国民保健服务体系和私人医疗保健领域对准确高效转录日益增长的需求。
随着电子健康记录、远程医疗和数字健康平台变得越来越普遍,对可靠的人工智能转录的需求从未如此之高。然而,传统的语音到文本模型经常与临床环境中使用的复杂和专业词汇作斗争,导致错误和“幻觉”,从而危及患者护理。
Deepgram的Nova-3 Medical旨在克服这些挑战。该模型利用先进的机器学习和专业的医学词汇训练来准确捕捉医学术语、首字母缩略词和临床术语——即使在具有挑战性的音频条件下也是如此。这在医疗保健专业人员可能远离录音设备的环境中尤为重要。
Deepgram首席执行官斯科特·斯蒂芬森表示:“新星3医疗代表了我们通过人工智能转变临床留档的承诺向前迈出了一大步。”“通过解决临床语言的细微差别并提供前所未有的定制,我们授权开发人员构建改善患者护理和运营效率的产品。”
该模型的主要特点之一是能够提供结构化转录,与临床工作流程和EHR系统无缝集成,确保重要的患者数据得到准确组织和易于访问。该模型还提供灵活的自助定制,包括多达100个关键术语的关键术语提示,允许开发人员根据各种医疗专业的独特需求定制解决方案。
多功能部署选项(包括本地和专有网络(VPC)配置)确保企业级安全性和HIPAA合规性,这对于满足英国数据保护法规至关重要。
“企业用例的语音到文本并非微不足道,为企业用例设计的语音人工智能平台与娱乐用例之间有着根本的区别,”OneReach.ai的管理合伙人凯文·弗雷德里克说。“就企业用例所需的准确率、延迟、效率和可扩展性而言,Deepgram的Nova-3模型和Nova-3-Medical模型是领先的语音人工智能产品,包括TTS。”
基准测试Nova-3 Medical:准确性、速度和效率
Deepgram进行了基准测试来展示Nova-3医疗的性能。该模型声称提供行业领先的转录准确率,优化整体单词识别和关键医学术语准确率。
- 字错误率(字符错误率): Nova-3 Medical的中位数字符错误率为3.45%,优于竞争对手,与第二好的竞争对手相比,错误减少了63.6%。这种增强的查准率/精确度最大限度地减少了手动更正并简化了工作流程。
- 关键字错误率(KER):至关重要的是,新星3医疗达到了6.79%的KER,与第二好的竞争对手相比,错误减少了40.35%。这确保了关键的医学术语——如药物名称和条件——被准确转录,降低了沟通不畅和患者安全问题的风险。
除了准确率之外,Nova-3 Medical在实时应用方面也表现出色。该模型转录语音的速度比许多替代语音识别供应商快5-40倍,非常适合远程医疗和数字健康平台。即使转录量增加,其可扩展架构也能确保高性能。
此外, Nova-3 Medical的设计具有成本效益。流媒体音频的起价为每分钟0.0077美元——Deepgram声称,这是领先云提供商的两倍多——它允许医疗保健技术公司对创新进行再投资,加快产品开发。
Deepgram的Nova-3 Medical旨在使开发人员能够构建变革性的医学转录应用程序,推动医疗保健领域的卓越成果。
本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:3164780!