36氪获悉,「达观数据」于昨日推出新产品“智能文本 RPA”。
达观数据成立于 2015 年,技术方向是自然语言处理(NLP),即在文本数据基础之上做各种应用,比如文本挖掘、搜索推荐等,主要产品是文本智能化处理软件系统,能够帮助客户完成文档智能审阅、推荐、搜索、客户意见洞察等工作。此前,达观已成功服务招商银行、中国平安、华为、中国移动等数百家金融、制造、军工、科技等领域企业和政府机构。
RPA(机器人流程自动化)是近两年较为火热的话题。简单来说,这是一项横向的、贴近业务流的技术,用于自动化处理重复、规则明确、并且需要人类切换不同系统来完成的工作。具体到产品形态,则是自动化软件,模拟人类的交互完成重复性事务。
举个例子,如果一个分析师每天需要关注一家上市公司的数据,每天要在同一个网站扒数据,并填到表内,那么 RPA 机器人就可以自动完成获取数据、填表、导出等工作。
具体到达观的 RPA 产品,主打 NLP + RPA + OCR,即在机器人里集成了 NLP(自然语言处理) 和 OCR (光学字符识别) 模块,优势在于能做更多复杂应用场景的业务流程自动化。陈运文表示,在企业流程中,大约 10 – 20%是简单业务流程,其他则是需要人工参与的复杂流程,本次达观推出的 RPA 产品,相当于是传统 RPA 的升级版,能够大大提高服务能力。
传统 RPA 产品由开发平台、控制中心、终端机器人组成。在 RPA 三大核心部分的产品功能设计上, 达观智能 RPA 产品负责人金克指出,面向企业级用户,达观数据会从擅长的 NLP 与 OCR所覆盖的场景切入,在产业设计层面结合两者的易用性与准确率。在前端,达观RPA提供两个版本,一个是面向业务人员的版本,可直接拖拽模块或录屏,无代码设置程序;另外也提供IT人员版本,可编程,用于更复杂的业务流程。
在目标市场上,达观的 RPA 产品面向的还是中大型客户,产品目前已经完成测试阶段,并有实际落地案例。从落地效果上看,达观 RPA 单个机器人能够完成 4 个普通员工的工作,成本在人类员工的25%。
达观数据副总裁贾学锋在发布会上也介绍,截至目前,达观智能 RPA 已推出银行、财税、政务、保险、证券基金等数十种不同岗位的机器人员工。在售后工单处理、商业案例报告生成、供应商准入核实、智慧政务行政审批、金融文档的抽取验查和填写等场景中已开展工作。
对于此次新产品发布,36氪也对达观数据创始人兼 CEO 陈运文进行了采访。
NLP+OCR,解决RPA“最后一公里问题”
陈运文表示,达观数据自 2017 年即接触到 RPA,并且与国内外 RPA 公司和咨询公司均有合作,发现 RPA 与 NLP 天然的互补性, NLP 技术是提高 RPA 能力的重要模块。因此,达观自 2018 年年初开始研发,并且于今年 1 月完成 RPA 产品 1.0 研发,推向试点客户。
他对 36 氪介绍:“在文本处理里,也分为简单和复杂流程,简单的文档处理可以通过 RPA 来完成,而复杂的的工作单靠 RPA 无法处理,达观即是补全了这块的能力。”
通过自然语言逻辑分类、自然语言数据提取、识别和深度学习模式预测,达观的新产品可以将 RPA 的应用场景覆盖面提升 80% 以上,比如能更好地解决传统 RPA无法处理的非结构化数据源问题,像图片验证码识别、证件识别、纸质文档识别、合同抽取、财务报表抽取、报告生成等业务需求。
比如说,金融行业和政府机构都有大量的资料报送和审查场景,存在大量非结构化的数据。陈运文以一个数据采集场景举例,一张单据上,无论填写者用“供应商”还是“甲方”,表达的意思是一样的,但对于 RPA 机器人来说,如果不知道两个字段的意思相通,抓数据的时候就会出现错误,这就需要 NLP 模块来帮忙。
RPA最早起源于国外,但陈运文认为,RPA 在中国规模化发展更需要做有中国特色的 RPA产品。和英文相比,中文更灵活,语法结构更复杂,这使得融合的 NLP 技术在实现路径和方法上存在一定的差异化,在语义理解上也面临更大的难度与挑战;另一方面,中国大型企业复杂的组织架构与权限划分需要从产品设计上做好不同部门、职级、角色的机器人隔离设计。
以 NLP 起家,为何做 RPA?
目前国内做 RPA 的公司大致分为几类:只做 RPA 的创业公司、传统的IT/运维/运营自动化厂商、巨头,以及人工智能公司,达观数据属于人工智能公司一类。
从业务逻辑来看,达观数据做 RPA 产品可以说顺其自然。
此前达观数据的主营产品“文本智能化处理软件系统”是以NLP+OCR为核心,完成实际业务中的文本数据抽取、识别、关联比对、核对、写作等环节。对于业务中的各种非结构化文档,前期获取数据即会涉及到跨系统抓取,获取后的处理环节,也需要结合业务操作流程。
与 RPA 的业务模式有共通互补之处,并且通过此前产品,已经了解了不少客户的实际业务流程——这也是达观数据将 RPA 与 NLP 结合的原因。
不过,现在 RPA 公司也会采取调用外部 NLP 模块来做文本处理,NLP 公司还有无自己做 RPA 的必要?陈运文表示:
第一,如果 RPA 公司调用国外的 NLP 模块,若对中文支持不好,机器人效率会不理想。
第二,RPA 贴近业务的特性,能让客户直观地看到业务效率的提升,ROI表现突出,这能很好地降低AI的落地门槛——若作比喻,那么RPA则是蛋壳,AI能力是内里,客户想要的是一整个鸡蛋,两者不能缺失。无论是在拓新客户,还是服务老客户层面,做 RPA 都是很好的选择。
相关阅读
36氪首发 | 「达观数据」完成1.6亿元B轮融资,宽带资本领投
文本挖掘有多大的想象空间?「达观数据」基本实现盈亏平衡
搜索难用、个性推荐不准?达观数据以此切入大数据服务