360ITO技术社区
  • 首页
  • 文章
  • 快讯
  • 讨论
  • 问答
  • 小贴士
  • 代码块
  • 开源
  • 老论坛
登录 | 注册

360ITO技术社区  > 讨论

订阅讨论
ljrj123

灵玖软件:NLPIR大数据中文挖掘平台为各个行业赋能

By ljrj123 at 1年前 , 4134 次点击  

  随着中国的经济迅速发展和对外交往的日益频繁,中文在国际上的地位也逐步提高。尽管中文被认为是世界上最难学的语言之一,但近年来,世界上学中文的人还是不断增加,这些人遍布亚洲、欧洲、美洲、非洲。而学习中文的人也不单纯是学习语言、文化、历史专业的学生,许多国家学习经济、贸易、法律专业的大学生也开始学习中文,他们认为掌握中文会对就业和工作有帮助。

  中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。用计算机来处理汉语信息,就是汉语信息处理,又称中文信息处理。

  中文信息处理是有关中文信息的采集、存储、传输和利用,是指利用电子计算机和现代通信、照明、排版、等自动化技术对汉字信息进行输入输出整理、加工、转换、传输、复制、等各种处理的一项新兴的科学技术。其交叉性使之成为“信息科学”的分支;其综合性应用使之成为“系统工程”的一个实例。它涉及到语言文字学、计算机科学、信息科学、工程心理学、数理统计学、声学、自动识别技术、人工智能、网络技术、文献检索学等等。故可以说它是一门新兴的多边缘科学。中国要实施先进的信息处理技术手段,中文信息化是一项重要的资源开发工作。中文信息网已逐渐成为我国现代化社会的神经系统,它将促进人民文化和社会生产效率迅速提高。中文信息处理工程已建立起现代化中文语言文字信息系统,使凝聚在语言文字中的知识信息发挥更大效能,使汉语汉字得到最佳利用。

  目前中文信息处理能力与国际上先进水平差距还很大。例如:自动分词和词性标注,至今还未开发出一个像日语分词系统那样被广为接受的分词标注系统。从采用的方法可以看出,随着研究的不断深入,基于统计的方法已逐渐暴露自身的缺陷,统计方法不可能解决所有的问题,还是需要结合基于规则的方法,才能在精度上得以突破;

  中文信息处理句法分析和语义分析问题;中文信息处理应用研究的问题,比如信息输入中的键盘输入和汉字识别发展已经成熟,但语音识别却很实现,困难是要适应不同人之间的语音变化以及外界的噪音干扰;中文信息处理研究分散而且存在着低层次重复、缺乏统一规范和标准的问题;现代汉语研究领域和计算机领域的隔绝状态没有出现根本性改变;汉语文和少数民族语言文字的信息处理技术与国际水平相比,还有相当大的差距。

  NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。

  NLPIR大数据语义智能分析平台主要有精准采集、文档转化、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重、全文检索、编码转换等十余项功能模块,平台提供了客户端工具,云服务与二次开发接口等多种产品使用形式。各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,Python,C,C#等各类开发语言使用。

  随着信息技术在我国社会生活各个领域应用的深入,中文信息处理正在成为人们工作和生活中不可或缺的手段,中文信息处理将具有更加广阔的市场。这将促使中文信息处理方面的高效中文搜索引擎、实时机器翻译、大规模中文文本处理、跨平台中西文自动识别转换、泛中文语义理解、中文电子商务等技术实现重大突破。中文信息处理已成为我国信息技术研究、发展、应用和产业的基础,在互联网日益成长的今天,中文信息处理技术将会更加成熟并创新。

阿里巴巴 软件服务 计算机技术 计算机

0个回复

按时间排 按有用数排

网友回复/评论仅代表其个人看法,并不表明本社区同意其观点或证实其描述。

请尽量让自己的回复能够对别人有帮助

热门标签

  • 软件服务 7
  • 阿里巴巴 6
  • 网络安全 3
  • 计算机技术 3
  • Flash 2
  • 移动应用 2
  • 计算机 2
  • Android Studio 1
  • android 1
  • delphi 1
  • meinheld 1
  • Flask 1
  • 无线网卡 1
  • Web Server 1
  • C/C++ 1

周热点

月热点

最近回复

15510626210 qifei233333333333
15510626210 qifei233333333333
15510626210 qifei233333333333
15510626210 qifei233333333333
15510626210 qifei233333333333
15510626210 qifei233333333333
15510626210 emmm
itolutan 想知道更多新游资讯 ,想了解最新游戏信息,想获取最新游戏下载,进入 www.nxm.com
itolutan 1. 需求管理:项目的需求变更,跟踪,控制 2. 资源管理: 项目的可利用的资源(人力
itolutan 1. 需求管理:项目的需求变更,跟踪,控制 2. 资源管理: 项目的可利用的资源(人力
itolutan 开发和运维“一体”的感觉是由开发人员和操作工程师之间的技能组合和实践的桥接以及自动化(De
不曾回想过去 在工程的Build.gradle中加入配置 android { dexOptions
谷啸メ雷 应该是忘记标出拉伸和显示范围了。
smallghost 谢谢!
忆桃园 在build.gradle中加入下面的配置: sourceSets { main
忆桃园 gradle默认的assets目录是assets,如果是改的话需要手动在gradle脚本中
smallghost 暂时没有时间解决了,下面给另外一个处理方法: 1、现在把资源移到 asset目录下
smallghost 在Settings里配置Gradle,在Gradle VM options中输入: -
比钱还重 在模块没有被引用的情况下是不会生成release.aar这个文件的,你可以试着看看引用一下
淡蓝色 方法重载:Ctrl + O 方法实现:Ctrl + I
Copyright ©2011-2012 360ITO技术社区 All Rights Reserved. | 关于 | 联系我们 | 杭州精创信息技术有限公司 浙ICP备09019653号-26|
▲