首页 国内 全球首个藏文搜索引擎“云藏”持续升级满足多种需求

全球首个藏文搜索引擎“云藏”持续升级满足多种需求

原标题:全球首个藏文搜索引擎“云藏”持续升级,满足各种需求 图为“云藏”大数据中心。 祁增蓓 摄 中信。青海海南9月16日电(齐增器)“我们正处于基于云的大数据…

原标题:全球首个藏文搜索引擎“云藏”持续升级,满足各种需求

图为“云藏”大数据中心。 祁增蓓 摄

中信。青海海南9月16日电(齐增器)“我们正处于基于云的大数据语料库开发阶段,主要包括分词语料库和汉藏双语平行语料库的开发,目的是提高信息检索系统的召回率和重复率,保证搜索结果的准确性。”15日,青海省海南州藏语信息技术研究中心自然语言处理研究所副所长杭告诉记者。

据云藏大数据中心相关人员介绍,云藏搜索是一个集新闻、网页、图片、视频、音乐、百科全书、图书馆、知识等为一体的大型综合藏文网络平台。它是中国各大藏文网站的统一入口,是互联网上藏文信息的主要来源和资源共享中心。

图为“云藏”大数据中心工作人员正在编写语料库。 马铭言摄

云藏文搜索采用目前最主流的算法,开发藏文自动分词和语言分析系统,构建大规模训练语料库,开发网页采集、全文搜索、内容管理模块、搜索网站前台、网络爬虫等系统架构建设。,完成了网页搜索等多个应用系统的构建,充分实现了一个搜索引擎应该具备的基本功能。

此外,云藏大数据中心成功开发了藏文自动分词和语言智能分析系统,实现了藏文同义词搜索、藏文拉丁音译搜索、藏文拼写检查系统、藏文语义检索、不同藏文代码自动转换等功能。,并克服了藏文智能信息处理的核心技术,成功实现了与搜索引擎系统的集成,使得云藏文搜索引擎具有本地化或藏文人工智能的特点。

图为“云藏”大数据中心工作人员讲解“云藏”使用方法。 祁增蓓摄

“下一步,云藏大数据中心将建设西藏互联网舆情监测分析系统,收集和分析西藏信息,掌握网络信息和舆情动向,充分了解社会状况和舆情,能够有效解决西藏网络舆情信息监测、控制和判断的瓶颈问题。”杭·蔡健说,他相信“区块链”技术在未来会发挥巨大的作用。

据悉,云藏大数据中心已申请“中国名牌”、“网络文化经营许可证”、“云藏百科”、“云藏图书馆”、“云藏知行”、“云藏视频”等6项计算机软件著作权,并向国家知识产权局申请了云藏搜索引擎系统、藏文词性标注系统、藏文分词系统等3项发明专利,已通过初审,目前处于最终实质性审查阶段。(结束)

[编辑:丁]

本文来自网络,不代表鄂州新闻网立场。转载请注明出处: http://www.ezezw.com/14627.html
上一篇
下一篇

为您推荐

返回顶部