首页国内新闻正文

海外new things | 数据标签技术初创「Heartex」更新Label Studio，用机器学习技术给音频“贴标签”

宋小予国内新闻

2022-12-29 17:47:24 0 237

据外媒TechCrunch报道，机器学习数据标签初创公司「Heartex」近期对其平台进行了重大更新，为“Label Studio”开辟了新的功能，使商业和开源版本中的音频文件注释变得更容易。

本次更新内容包括一个全新的用户界面，优化了音频文件处理流程，能够注释最长两小时的文件，在内置注释工具中进行毫秒级操作。此外，新版本还增加了能够显示波形的渲染引擎，增加了逐帧视频跟踪，更新了交互界面。

该公司声称，目前约有15万用户在使用“Label Studio”，迄今为止已创建了超过9500万条注释。

图片由企业官方提供

「Heartex」联合创始人兼首席执行官Michael Malyuk表示：“在最初考虑构建数据标签解决方案时，我们与数据科学家做了大量的访谈。在这个过程中，我们发现很多人认为现有的工具没有足够的灵活性。图像编辑工具通常只能同时处理一张图片，而音频工具通常是硬编码的。我们认为，Label Studio应当成为一款支持数据科学家各种各样用例的产品。”

Label Studio的想法是，让任何人都能给数据贴上标签。Malyuk解释说：“我们认为，每家人工智能公司都将转变为数据标签公司或数据集开发公司。从本质上讲，「Heartex」希望将Label Studio打造成一个集成开发环境（IDE）。”

展望未来，该公司计划大力投资于用户社区，计划在明年举办第一届“Label Studio”用户大会。

国内方面，数据显示，中国网络音频行业市场规模仍然处于高速发展期，2020年的市场规模达到了123亿元，增长率为36.7%，预计到2023年可以超过100亿。艾媒咨询指出，用户的对音频的付费意愿的提升、有声书配套行业的逐渐成熟、网络文学市场的发展、以NLP与音频合成技术为代表的AI技术蓬勃发展等都是推动有声书市场发展的重要因素。常见的音频剪辑工具包括Audacity、Adobe Audition、Ocenaudio、LMMS、WavePad等。

收藏 (0) 打赏