合合信息智能创新事业部总经理唐琪受邀参加全体大会

2022-10-28 19:06:27 0 145

1024是2的十次方,也是二进制计数的基本计量单位之一,每年的10月24日因此成为了中国程序员的盛会。近期,CSDN(中国开发者网络)第三届“1024程序员节”(简称“大会”)顺利举办,来自Linaro等开源组织的领导者和微软、腾讯、华为、合合信息等企业的技术专家接连登陆主论坛重磅活动《全体大会:2022技术英雄会》,与观众云端话科技。

怎样从数据中发现更多的价值,找到更实用的开发工具,是程序员群体重点关注的话题。合合信息智能创新事业部总经理唐琪受邀分享智能文档处理的技术优化方法及开源渠道介绍,获得了众多开发者的认可。

“智能文档处理”在开发者群体中热度攀升(图源:CSDN官网)

智能文档处理技术本质上是把文档里的信息从载体中剥离出来,将其对接到其他系统,以数据的流转实现流程自动化的技术。典型场景如单据的自动审核,就是先对单据进行图像检测,从中提取所需信息并录入到系统里,经过结构化处理,“翻译”成机器能理解的内容后再进行自动判别,达到节省人工成本、提高工作效率的目的。

唐琪在分享中指出,采集设备的不确定性和文档版式的多样性,导致文档在处理过程中经常遇到“看不清、看不准、认不全、难理解”四大类问题。合合信息在弯曲矫正、去摩尔纹(屏幕纹)等图像质量增强领域进行了深入研究,为信息的提取、存储、检索、管理等后续工作创造良好的环境。

“在各种场景的实践中我们发现,单纯的文字识别不足以支撑更细致的文档处理需求,版面元素分析才是基础。”唐琪提到,文档处理过程中要重点关注对印章、logo、水印、页眉、二维码、公式等元素的检测,根据检测结果采取对应的版式分析方式,可得到更精准的识别结果。

如何让已经接受过市场检验的技术产品惠及更多的开发者?技术服务的共享是促进科技创新的重要渠道。合合信息将在制造业、金融业、物流业等30个行业应用里打磨出的核心技术产品“智能文字识别服务平台”(简称“平台”)以SaaS的形式免费开放给个人开发者,助力使用者们低成本、高效率获取贴合个性化需求的定制模型。

受远程办公趋势发展和环保“无纸化”倡导的影响,社会对智能文档处理技术的需求不断增加。据介绍,合合信息智能文档处理技术可支持全球超过50种主流语言的印刷体、手写体的高精度识别,以及增值税发票、出租车票等20多种票据的识别,这些通用识别、信息抽取能力被搭载于合合信息智能文字识别服务平台SaaS版中,并于大会上开放试用。

该平台提供了海量训练数据快速生成、自动化模型生成、完整的模型训练和测试等功能,使用者通过云端的简单操作,仅需10张样本就可以开始训练。

据悉,实测中应用人员最短可在10分钟内完成抽取模型开发全流程,可视化界面设计让没有算法基础的业务人员也可顺利使用。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

免责声明:内容来自用户上传发布或新闻客户端自媒体,本站仅提供信息存储空间服务,如违规请联系删除。

玩技资源 国内新闻 合合信息智能创新事业部总经理唐琪受邀参加全体大会 https://www.52diyhome.com/2022/10/71198.html

如遇资源失效请马上联系微信进行退款

常见问题
  • 答:资源大部分来源于网络和本站作者若有侵权请您联系管理员删除2523030730
查看详情
  • 玩技平台的主要负责内容是提供给作者售卖资源的平台,买家有对作者投诉的权利,投诉成功后会获取相应的补偿机制。官方唯一投诉通道客服QQ:2523030730转接人工服务,投诉专属客服工号【2】
查看详情
  • 本站已开启了作者实名认证,在购买商品时请尽量选择已认证的作者,不用担心跑路和无人售后的问题。如果出现问题,本站将采取报警的方式来指正作者进行诈骗行为,并将其身份资料提供给警方处理。
查看详情
  • 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
查看详情

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 工作日在线 专业服务

  • 0 +

    访问总数

  • 0 +

    会员总数

  • 0 +

    资源总数

  • 0 +

    今日发布

  • 0 +

    本周发布

  • 0 +

    运行天数

资源在于分享,创作来源想象