广东工业大学学报 ›› 2017, Vol. 34 ›› Issue (03): 30-35.doi: 10.12052/gdutxb.170026

• 大数据基础理论与应用专题 • 上一篇    下一篇

用信息流和知网构建大数据语义共享通道研究

毛莉娜1, 李卫华2   

  1. 1. 广东轻工职业技术学院 机电系, 广东 广州 510300;
    2. 广东工业大学 计算机学院, 广东 广州 510006
  • 收稿日期:2017-01-19 出版日期:2017-05-09 发布日期:2017-05-09
  • 通信作者: 李卫华(1957-),女,教授,主要研究方向为智能软件、面向Agent计算和网络信息系统.E-mail:lw@gdut.edu.cn E-mail:lw@gdut.edu.cn
  • 作者简介:毛莉娜(1988-),女,讲师,硕士,主要研究方向为自动控制技术、计算机应用技术和软件工程.
  • 基金资助:

    国家自然科学基金资助项目(61273306,61571141);广东省教育厅科技创新项目(2013KJCX0119);广东省科技厅2014年度公益研究与能力建设项目(2014A010104013);江西省科技计划项目(20141311100020)

Research on using information flow and HowNet to build big data semantic sharing channel

Mao Li-na1, Li Wei-hua2   

  1. 1. Department of Mechanical and Electrical Engineering, Guangdong Industry Polytechnic, Guangzhou 510300, China;
    2. School of Computers, Guangdong University of Technology, Guangzhou 510006, China
  • Received:2017-01-19 Online:2017-05-09 Published:2017-05-09

摘要:

大数据除了数据量巨大之外,而且具有类型繁多、信息表示结构各异、语法语义冲突和动态变化等特点,故难以共享.为了共享大数据中的语义信息,必须有满足动态、异构和大规模等特点的共享机制.本文分析了信息流(Information Flow)理论,也称为通道理论(Channel Theory),以及知网(HowNet)技术,二者相结合可以作为大数据语义理解的基础.提出了用信息流理论和知网共同构建基于语义的大数据共享通道的观点,用信息源分类本体、社团本体和通道本体作为语义共享的核心机制,通过信息射构成大数据语义共享通道.并用职业信息共享为案例进行初步实践,结果体现了所构建通道的有效性.

关键词: 大数据, 语义, 信息流, 通道, 知网

Abstract:

In addition to the huge amount of data, wide range of data, different information structure, grammatical and semantic conflicts, highly heterogeneous and dynamic, big data is difficult to share. In order to share the semantic information in big data, there must be a sharing mechanism with dynamic, heterogeneous and large-scale features to enable users to share semantic information of big data. Information Flow theory, also called Channel Theory, as well as HowNet, have been analyzed. Combine them provide us bases of big data semantic understanding. The idea of building the big data semantics sharing channel based both on the information flow theory and Hownet is present. Information resources classify ontology, society ontology and channel ontology act as the kernel of the semantic sharing. Build the big data semantic sharing channel by infomorphisms. Professional information sharing as case study has carried on the preliminary practice. The experiment results show the effectiveness of the constructed channel. Combining information flow theory and HowNet technology can form a useful big data semantic sharing channel.

Key words: big data, semantics, information flow, channel

中图分类号: 

  • TP311

[1] (英)维克托·迈尔·舍恩伯格, (英)肯尼思·库克耶. 大数据时代:生活、工作与思维的大变革[M]. 盛杨燕, 周涛, 译. 杭州:浙江人民出版社, 2013.
[2] 李国杰, 程学旗. 大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27(6):647-657. LI G J, CHENG X Q. Research status and scientific thinking of big data[J]. Bulletin of Chinese Academy of Sciences, 2012, 27(6):647-657
[3] 靳小龙, 王元卓, 程学旗. 大数据的研究体系与现状[J]. 信息通信技术, 2013, (6):35-43. JIN X L, WANG Y Z, CHENG X Q. Research system and status of big data[J]. Information and Communications Technologies, 2013, (6):35-43.
[4] BIZER C, TOM H, TIM B-L. Linked data-the story so far[J]. International Journal on Semantic Web and Information Systems, 2009, 5(3):1-22.
[5] 何克清. 本体元建模理论与方法及其应用[M]. 北京:科学出版社, 2008:1-307.
[6] 何向武. 大数据中RDF语义数据存储优化探讨[J]. 计算机应用与软件, 2015, 32(4):38-41. HE X W. Probing optimisation of RDF semantic data storage in big data[J]. Computer Applications and Software, 2015, 32(4):38-41.
[7] 吴纯青, 任沛阁, 王小峰. 基于语义的网络大数据组织与搜索[J]. 计算机学报, 2015, 38(1):1-17. WU C Q, REN P G, WANG X F. Survey on semantic-based organization and search technologies for network big data[J]. Chinese Journal of Computers, 2015, 38(1):1-17.
[8] 陈曦, 陈华钧, 顾珮嵚, 等. 一种基于Hadoop的语义大数据分布式推理框架[J]. 计算机研究与发展, 2013, 50(增刊):103-113. CHEN X, CHEN H J, GU P Q, et al. A distributed reasoning framework for big semantic data based on Hadoop[J]. Journal of Computer Research and Development, 2013, 50(suppl.):103-113.
[9] 杨杰, 李小平, 潘丽娅. 面向道路交通监控网的异构大数据语义融合方法[J]. 东南大学学报(自然科学版), 2014, 44(5):907-911. YANG J, LI X P, PAN L Y. Semantic fusion method for heterogeneous big data of traffic monitoring systems[J]. Journal of Southeast University(Natural Science Edition), 2014, 44(5):907-911
[10] 杨鵾. 基于语义的金融行业大数据整合及处理技术[D]. 杭州:浙江大学计算机科学与技术学院, 2013:1-67.
[11] BARWISE J, SELIGMAN J. Information flow:the logic of distributed systems[M]. Cambridge:Cambridge University Press, 1997:1-274.
[12] 李卫华, 李师贤. 信息流理论及其应用研究[J]. 计算机科学, 2006, 33(7):11-15. LI W H, LI S X. The research of information flow theory and its applications[J]. Computer Science, 2006, 33(7):11-15.
[13] 李卫华. 网格信息服务Agent资源共享互操作语义研究[D]. 广州:中山大学信息科学与技术学院, 2005:1-100.
[14] 李卫华. 利用知网增强可拓策略生成机制研究[J]. 广东工业大学学报, 2013, 30(2):1-6 LI W H. Research on taking advantage of the HowNet to Enhance mechanisms of extension strategy generation[J]. Journal of Guangdong University of Technology, 2013, 30(2):1-6
[15] 赵杰, 李卫华. 基于知网的矛盾问题语义二义性研究[J]. 广东工业大学学报, 2014, 31(2):21-26 ZHAO J, LI W H. Research on the ambiguity of contradiction based on HowNet[J]. Journal of Guangdong University of Technology, 2014, 31(2):21-26
[16] SHANNON C. A mathematical theory of communication[J]. The Bell System Technical Journal, 1948, 27:379-423, 623-656
[17] KENT R E. The information flow foundation for conceptual knowledge organization[C]//6th International Conference of the International Society for Knowledge Organization. Toronto:[s.n.], 2000:1-7.
[18] MARCO S, YANNIS K. On semantic interoperability and the flow of information[J]. Revista Mexicana De Ciencias Geológicas, 2003, 30(1):80-95.
[19] ALLWEIN G, MOSKOWITZ I S., CHANG L W. A new framework for Shannon information theory[R]. Washington:NRL Memorandum Report, 2004:1-17.
[20] WORBOYS M F. Communicating geographic information in context[C]//DUCKHAM M, GOODCHILD M, WORBOYS M F, et al. Foundations of Geographic Information Science. London and NewYork:Taylor & Francis, 2003:33-45.
[21] 董振东, 董强. 知网和汉语研究[J]. 当代语言学, 2001, 3(1):33-44. DONG Z D, DONG Q. Hownet and Chinese research[J]. Contemporary linguistics, 2001, 3(1):33-44.
[22] 董振东, 董强, 郝长伶. 知网的理论发现[J]. 中文信息学报, 2007, 21(4):3-9. DONG Z D, DONG Q, HAO C L. Theoretical findings of HowNet[J]. Journal of Chinese information processing, 2007, 21(4):3-9.
[23] 李景, 苏晓鹭, 钱平. 构建领域本体的方法[J]. 计算机与农业, 2003, (7):7-10. LI J, SU X L, QIAN P. The methodology of developing domain ontology[J]. Computer and Agriculture, 2003, (7):7-10.
[24] 陈珊珊. 基于语义的大学生就业推荐系统研究[D]. 武汉:武汉科技大学信息科学与工程学院, 2014:1-46.

[1] 杨运龙, 梁路, 滕少华. 一种双路网络语义分割模型[J]. 广东工业大学学报, 2022, 39(01): 63-70.
[2] 滕少华, 董谱, 张巍. 融合语义结构的注意力文本摘要模型[J]. 广东工业大学学报, 2021, 38(03): 1-8.
[3] 张雪娇, 刘攀, 杨雪强, 汪洋. 石灰改良黄土渗透性与孔隙结构的关系研究[J]. 广东工业大学学报, 2021, 38(03): 97-103.
[4] 刘洪伟, 梁周扬, 左妹华, 陆丹, 范梦婷, 何锐超. 利用消费者浏览行为识别品牌竞争关系研究[J]. 广东工业大学学报, 2019, 36(05): 1-6,13.
[5] 谢岩, 刘广聪. 基于编解码器模型的车道识别与车辆检测算法[J]. 广东工业大学学报, 2019, 36(04): 36-41.
[6] 黄健文, 朱雪梅, 徐莹, 熊璐, 张伟国. 基于多源大数据的岭南地区老旧小区空间形态量化研究[J]. 广东工业大学学报, 2019, 36(04): 70-79.
[7] 白颉, 姚家进, 张茂军, 李桥兴. 金融大数据中条件非相关波动模型的单纯形搜索算法[J]. 广东工业大学学报, 2018, 35(05): 26-30.
[8] 彭嘉恩, 邓秀勤, 刘太亨, 刘富春, 李文洲. 融合社交和标签信息的隐语义模型推荐算法[J]. 广东工业大学学报, 2018, 35(04): 45-50.
[9] 孙为军, 谢胜利, 汪谷银, 刁俊武, 阮航. 智能工厂工业大数据云平台的设计与实现[J]. 广东工业大学学报, 2018, 35(03): 67-71.
[10] 李卫华, 李志猛. 基于大数据运输集团生产运营决策系统的构建及应用[J]. 广东工业大学学报, 2018, 35(03): 113-118.
[11] 饶东宁, 王军星, 魏来, 王雅丽. 并行最小割算法及其在金融社交网络中的应用[J]. 广东工业大学学报, 2018, 35(02): 46-50.
[12] 徐慧, 陈宏伟, 宗欣露. 基于可拓论的SDN管理信息语义不匹配问题研究[J]. 广东工业大学学报, 2017, 34(04): 17-21.
[13] 李永亮, 周雷, 晏浩然, 江青云, 钟熙微. 基于模糊算法的智能变电站继电保护可靠性评估[J]. 广东工业大学学报, 2017, 34(04): 65-71.
[14] 谢振东, 吴金成, 李之明, 伍冠桦. 企业大数据能力的构建与培育研究[J]. 广东工业大学学报, 2017, 34(03): 110-114.
[15] 饶东宁, 温远丽, 魏来, 王雅丽. 基于Spark平台的社交网络在不同文化环境中的中心度加权算法[J]. 广东工业大学学报, 2017, 34(03): 15-20.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!