据外媒TechCrunch报道,机器学习数据标签初创公司「Heartex」近期对其平台进行了重大更新,为“Label Studio”开辟了新的功能,使商业和开源版本中的音频文件注释变得更容易。
本次更新内容包括一个全新的用户界面,优化了音频文件处理流程,能够注释最长两小时的文件,在内置注释工具中进行毫秒级操作。此外,新版本还增加了能够显示波形的渲染引擎,增加了逐帧视频跟踪,更新了交互界面。
该公司声称,目前约有15万用户在使用“Label Studio”,迄今为止已创建了超过9500万条注释。
图片由企业官方提供
「Heartex」联合创始人兼首席执行官Michael Malyuk表示:“在最初考虑构建数据标签解决方案时,我们与数据科学家做了大量的访谈。在这个过程中,我们发现很多人认为现有的工具没有足够的灵活性。图像编辑工具通常只能同时处理一张图片,而音频工具通常是硬编码的。我们认为,Label Studio应当成为一款支持数据科学家各种各样用例的产品。”
Label Studio的想法是,让任何人都能给数据贴上标签。Malyuk解释说:“我们认为,每家人工智能公司都将转变为数据标签公司或数据集开发公司。从本质上讲,「Heartex」希望将Label Studio打造成一个集成开发环境(IDE)。”
展望未来,该公司计划大力投资于用户社区,计划在明年举办第一届“Label Studio”用户大会。
国内方面,数据显示,中国网络音频行业市场规模仍然处于高速发展期,2020年的市场规模达到了123亿元,增长率为36.7%,预计到2023年可以超过100亿。艾媒咨询指出,用户的对音频的付费意愿的提升、有声书配套行业的逐渐成熟、网络文学市场的发展、以NLP与音频合成技术为代表的AI技术蓬勃发展等都是推动有声书市场发展的重要因素。常见的音频剪辑工具包括Audacity、Adobe Audition、Ocenaudio、LMMS、WavePad等。