English
 
您现在的位置 首页 > 解决方案 >  企业多语信息处理平台
企业多语信息处理平台解决方案
    信息对于企业的跨国经营是一种稀缺资源,谁能够在充满竞争的环境中占领信息渠道的制高点,就可能在激烈的市场竞争中处于有利地位。随着中国加入WTO后国际国内市场交流与融合步伐的加快,以翻译为核心的多语信息处理应用需求正以前所未有的速度迅猛发展。
    本系统解决方案将提供面向企业特定信息的自动获取、分类、检索、摘要、翻译、修订、发布等功能于一体的多语信息处理平台,在最短时间内向分散在全球各地用户传递多语种(中、英、法、德等)、多类型(网页、word文档、pdf文档等)、各种用途(业务处理、决策支持等)的信息。 系统包括诸多独立功能模块,并将与现有企业内容管理平台相融合,将以核心业务的信息化助推企业的国际化进程。

企业多语信息处理需求
多语信息自动翻译系统
    语言障碍是企业国际化进程中需要解决的一个基本问题。从基本的来自国外的设备资料、资源信息,到日常工作中的技术交流、业务往来,翻译工作已成为企业运作和发展中必不可少的支撑工具。翻译系统及其相关软件工具在企业整体信息平台中占据重要地位。
多语信息门户
    近年来,大型跨国企业纷纷上市或准备上市,可是如何使母公司与下属企业的对外窗口保持统一,如何树立国际化大公司的形象,品牌建设如何与国际接轨?此外,企业信息化的发展凸现出门户的重要性,如何架构门户内容基础架构?怎样才能使企业的内外网协同运作、实现门户效益最大化?因此,急需一个多语言信息门户是解决这些问题,实现多语言信息的同步发布,并将各个应用系统联系在一起。
跨语言检索
    在网络时代,几乎所有的数字化信息都在互联网上生成、存储、传播和转换。对网络用户而言,当前最迫切的需求是如何迅速而准确地从浩如烟海的信息中检索出自己所需的部分。然而,面对占互联网内容90%以上的外文,大多数中国用户都感到无从下手,语言障碍成为他们使用计算机和应用网络资源的最大问题,跨语言信息检索变得势在必行。
多语言信息获取
    跨国企业应该是一个放眼世界、以国际市场信息为基本业务情报的有机组织。因此,跨国企业的信息化系统必须首先满足多语言信息获取的需要,能够迅速获取市场信息、竞争对手信息、生产资料信息、相关企业信息以及国际政治局势信息,并能够对这些信息进行加工,包括格式转化、内容过滤、编辑审批等,提取有效信息为决策层作出有效决策提供帮助,从而进行全方位、有体系的跟踪,把握国际行业动态,建立国际化的信息资源库应当成为中国企业信息化建设的基础设施。
海量多语文档的自动分类和摘要
    大型跨国企业的项目一般周期比较长,有时一个项目要持续一年甚至几年,项目内容繁多,生成大量各种格式的文档。当前,这些合同和文档只能以单独文件的形式存储,如何使项目文档、合同有效整合、管理及再利用,为企业员工、客户及合作伙伴提供与项目相关的最新最及时的内容。同时,由于跨国企业规模庞大,企业内部分工细致,部门和分支机构众多,如何实现企业内部横向和纵向的知识交换和知识共享具有很大难度。
信息抽取
    有统计分析表明,现代国际化企业中,百分之八十的商务运营是以非结构化信息为基础,例如,网页、电子邮件、PDF、办公文件,语音邮件等等,而且这个数字仍在成倍增长。如何从这些信息中抽取出感兴趣的信息对一个企业信息的整合和利用非常关键。而从繁杂的非结构化数据中进行有效信息抽取难度很大。

系统实现方案

总体构架
    解决方案主要包括三层:
    最上层是“应用软件层”,提供各种应用软件和开发工具包SDK/API;
中间层是“信息智能操作层”,提供机器翻译、文本分类、内容概括、信息聚类等多种信息 操作功能;
    最底层是“多元信息流处理层”,处理来自各种不同信息源的数据和文件格式,包括结构化信息和非结构化信息。

应用软件构成
    构建在“信息智能操作层”之上的应用软件层,提供了各种应用软件和开发工具包SDK/API。比如:文档翻译系统,辅助翻译系统,企业本地化系统,企业电子门户,用户关系管理系统,知识管理系统,电子商务系统,等等。这些应用软件与“信息智能操作层”的关系都是构架在HTTP协议和XML网络服务标准之上,非常方便用户定制和系统扩展。目前主要应用软件有:文档自动翻译、智能辅助翻译、网站多语信息发布、跨语信息检索、行业信息跟踪、企业竞争情报分析、多语信息门户、文档自动摘要、文本信息分类和知识管理等。
信息智能操作层
    设置“信息智能操作层”的目的是为了能够自动地把不同的信息源和不同的文件格式统一在一个智能的信息操作系统之下。这个智能信息操作系统可以提供多种信息操作的功能,比如机器翻译、自动连接、文本分类、内容概括、信息聚类等等。“信息智能操作层”主要包括智能多语机器翻译引擎、智能多语信息搜索引擎、智能动态推理引擎、智能分类服务和智能用户代理等五大功能模块。
智能多语机器翻译引擎
    “智能多语机器翻译引擎” (Intelligent Multilingual Machine Translation Engine, IMMTE)是最重要的核心服务器产品部件之一,提供多语言、多策略(即包括基于规则的转换分析和基于实例模式的类比分析)的机器翻译方法。
智能多语信息搜索引擎
    “智能多语信息搜索引擎” 是“信息智能操作层”中的第二个核心部件,提供跨语言关键词检索、相似性检索和分类检索等功能。
智能动态推理引擎
    “智能动态推理引擎”是一个扩展性极强、多线程的核心引擎。概念分析、内容提取、概念模式识别、相关度计算等关键工作都是由动态推理引擎来完成。当配置设定好以后,动态推理引擎将自动运行,接收和处理新的信息,并向其它软件部件,通过HTTP(XML) 来提供功能服务。
智能分类服务器
    智能分类服务器负责提供诸如自动分类,自动信息群识别等功能。
分布式多元信息流处理层
    “分布式多元信息流处理层”的设计,就是为了方便快速地处理来自各种不同信息源的海量信息。主要包括分布式查询服务器、分布式编引服务器、分布式服务控制器、连接器等四个子模块。
分布式查询服务器
    分布式查询服务器,DQH (Distributed Query Handler): 每个分布式查询服务器可以与多个动态推理引擎服务器连接。分布式查询服务器还可以与其它分布式查询服务器连接。这些连接都是使用HTTP协议并遵循XML标准。分布式查询服务器可以提供更可靠的功能服务,更好的容灾能力,更快的响应时间,并打破地域界限,提高系统的可伸展性和灵活性。
分布式编引服务器
    分布式编引服务器,DIH (Distributed Index Handler):每个分布式编引服务器可以与多个连接器和动态推理引擎服务器连接。这些连接也都是使用HTTP协议并遵循XML标准。分布式编引服务器打破了地域界限,提高系统的可伸展性和灵活性。
分布式服务控制器
    分布式服务控制器:DiSH (Distributed Service Handler): 控制和监视整个系统的运行,使得系统中所有服务器的状态一目了然。
系统功能和特性
    系统提供了非常丰富的多语言文本信息处理功能,主要包括多语言信息自动翻译、内容管理、自动内容综合和精炼、信息抽取、多语信息门户和多语信息发布等功能。同时由于合理的系统设计,使得系统具有很高的安全性、很好的拓展性以及很好的语言独立性和易集成性。
多语言信息自动翻译
    企业里需要翻译处理的信息(如公司网站和门户上,需要采用多种语言展现的信息,包括企业简介、产品描述,外商和合作伙伴提交的非中文的定购信息等),可以采用机器翻译技术进行实时的翻译处理,把一种语言自动翻译成另一种语言,或在机器翻译基础上,采用人工辅助的方法进行处理。因此,该系统提供两种翻译功能:实时翻译浏览和辅助翻译功能。
多语种网页和email的实时浏览翻译
    通过该功能,以其它语言为母语用户可以在网络上实时翻译自己需要的信息,并保持网页格式和超链接不变,极大地方便跨国企业的国际合作交流与沟通。
智能辅助翻译
    该功能主要针对多种语言信息发布的需要而设计的。在企业内部有各种语言的信息需要发布,完全靠人力解决这些问题,工作量很大而且更新周期也长。辅助翻译系统的目标就是利用翻译记忆知识库和相关技术辅助人们进行多语信息处理,提高翻译转换的准确性和效率。该功能将各种翻译的语料进行记忆,并采用相关的算法进行集成,在这样不断的积累和人员对语料的整理过程中,信息再次翻译时速度和效果都会大幅提升。
多语信息门户
    企业可以用多语信息门户发布存储在企业内部和外部的各种多语信息,使企业员工、客户和合作伙伴能够从单一的渠道访问其所需的个人化信息。多语信息门户可以及时地向企业用户提供准确的信息,以实现企业运作的优化,并提高生产力。利用该系统,可以将企业内的任何信息发布到企业门户中,并集成企业内的各种应用系统,实现企业内部资源的高度整合和统一流转。
多语信息发布
    信息发布系统用来帮助企业建立内部信息网和知识库。企业可以建立分类信息版块,发布企业的各种分类信息。所有信息最终都可以发布到企业门户中。信息发布支持HTML超文本格式,可以直接将各种网页发布到信息中。该系统还提供建站向导自动生成新的外网网站系统,并将信息发布到外网。
内容管理和操作
    主要对获取到的信息进行内容管理和操作,包括文档之间的自动交叉索引、动态内容摘要、主动匹配、全文检索和跨语言检索等功能。
分类操作
    分类操作主要包括自动语言探测、自动分类、自动聚类、自动分类生成器、专业技术标识和信息发送等功能。