早期项目 |AI企业「澜舟科技」自研开源语言大模型 ,提供以 NLP 为核心的行业知识服务平台

2023-02-27 22:20:10 0 126

文 | 周鑫雨

编辑 | 苏建勋

在由ChatGPT引发的大模型热潮中,不少国内的初创企业希望能走出一条中国化道路。

成立于2021年的澜舟科技是由李开复的创新工场从0孵化的AI企业。据创始人周明介绍,澜舟科技致力于解决人类的语言理解和生成难题,提供基于NLP(自然语言理解)技术的开源大模型以及聚焦于营销、金融、文化创意等场景的功能引擎和应用。

2018年以来,BTA、华为等国内互联网厂商在大模型的研发上已经开始涉猎。周明发现,互联网企业的大模型主要服务于企业内部,鲜少对外赋能。研发大模型对中小企业来说有较高门槛,国内相关的AI服务较少,大多公司只能选择接入海外的开源模型。

为此,澜舟科技于2021年7月推出了孟子大模型及相关系列开源模型。基于Transformer,孟子大模型可支持以及快速替换自回归(如GPT)、自编码(如BERT)等多种预训练模型。

在周明看来,初创公司在大模型领域依然有试探天花板的机会。基于网上的公开数据和合作伙伴提供的数据,澜舟科技选择在算法能力上下功夫,而非狂堆参数的“暴力”模式。

最终,澜舟科技花了近一年的时间打磨出了孟子大模型。在模型榜单CLUE发布的中文理解评测排行榜中,孟子大模型分数突破84分,逼近人类基准分数(85.61分)。

目前,孟子大模型已开源17个模型,分别可应用于自然语言理解、金融资料分类、可控文本生成和图片生成等场景。同时,澜舟科技还为下游应用场景提供了句向量计算(用于捕捉文本间的语义相似性)和大模型定制的服务。

除此之外,面向营销、金融、文化创意等场景,澜舟科技推出了AIGC(智能创作平台)、机器翻译平台、金融NLP平台等toB+toC服务。目前,澜舟科技已与华为云、传神语联网、中文在线等企业达成合作,并与北大、清华等10所高校进行产学研的联璧。

目前澜舟科技也在打磨不同规模的ChatGPT模型,从10亿参数、100亿元参数到1000亿参数,适应不同需求。同时在大模型底座基础上,也在考虑训练垂直领域的大模型。澜舟长期以来一直从事金融领域的大模型,最近与中文在线合作宣布,合作打造一款用于网文写作的类ChatGPT模型。

澜舟科技创始人周明于1999年加入微软亚洲研究院并长期领导NLP研究,其团队为微软必应搜索、Office、Azure、微软小冰等产品贡献了核心的 NLP 技术。澜舟科技三名合伙人在大数据、人工智能等领域均有较为丰富的从业或研究经验。

“在国内开源语料稀缺的情况下,中文的数据量大概在英文的1/10,短期内,中文大模型追赶上ChatGPT有一定难度。”周明告诉36氪,“不过,只要AI大模型与上下游自上而下或自下而上形成一个良好的生态或闭环效应,国产的中文ChatGPT是可以期待的。”

36kr制图

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

免责声明:内容来自用户上传发布或新闻客户端自媒体,本站仅提供信息存储空间服务,如违规请联系删除。

玩技资源 国内新闻 早期项目 |AI企业「澜舟科技」自研开源语言大模型 ,提供以 NLP 为核心的行业知识服务平台 https://www.52diyhome.com/2023/02/208126.html

常见问题
  • 答:资源大部分来源于网络和本站作者若有侵权请您联系管理员删除2523030730
查看详情
  • 玩技平台的主要负责内容是提供给作者售卖资源的平台,买家有对作者投诉的权利,投诉成功后会获取相应的补偿机制。官方唯一投诉通道客服QQ:2523030730转接人工服务,投诉专属客服工号【2】
查看详情
  • 本站已开启了作者实名认证,在购买商品时请尽量选择已认证的作者,不用担心跑路和无人售后的问题。如果出现问题,本站将采取报警的方式来指正作者进行诈骗行为,并将其身份资料提供给警方处理。
查看详情
  • 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
查看详情

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 工作日在线 专业服务

  • 0 +

    访问总数

  • 0 +

    会员总数

  • 0 +

    资源总数

  • 0 +

    今日发布

  • 0 +

    本周发布

  • 0 +

    运行天数

资源在于分享,创作来源想象