广东工业大学学报 ›› 2014, Vol. 31 ›› Issue (3): 8-13.doi: 10.3969/j.issn.1007-7162.2014.03.002

• 综合研究 • 上一篇    下一篇

大数据基元的HBase数据库存储模型与实现

李桥兴1,3,4,强保华2,杨春燕3   

  1. 1. 兰州理工大学 经济管理学院,甘肃 兰州 730050;2.桂林电子科技大学 广西可信软件重点实验室,广西 桂林 541004;
    3.广东工业大学 可拓学与创新方法研究所,广东 广州 510006;4. 兰州大学 管理学院,甘肃 兰州 730000
  • 收稿日期:2014-07-07 出版日期:2014-09-30 发布日期:2014-09-30
  • 作者简介:李桥兴(1973-),男,副教授,博士,主要研究方向为系统科学与复杂性管理、资源经济与管理和城市化管理等.
  • 基金资助:

    国家自然科学基金资助项目(61273306)

The Storage Model of Big Data Basicelements in HBase Database and Its Realization

Li Qiao-xing1,3,4, Qiang Bao-hua2, Yang Chun-yan3   

  1. 1. School of Economics and Management, Lanzhou University of Technology, Lanzhou 730050, China;
    2. Guangxi Key Lab of Trusted Software, Guilin University of Electronic Technology, Guilin 541004, China;
    3. Institute of Extenics and Innovation Method, Guangdong University of Technology, Guangzhou 510006, China;
    4. School of Management, Lanzhou University, Lanzhou 730000, China
  • Received:2014-07-07 Online:2014-09-30 Published:2014-09-30

摘要: 大数据将在未来经济、社会和生活等领域产生深远影响,而大数据的整合存储研究为促进和深化其应用范围有重要的理论和实践意义.本文利用分布式文件系统HBase的数据存储结构特征,采用可拓学基元对异构数据集进行整合处理并存储在HBase数据库.通过提取数据特别是半结构化和非结构化数据的典型特征和属性取值并转换为基元后生成一个新的数据集,不但为数据分析和数据解释提供一种新的实现方式,而且为领域问题的策略生成提供大数据的研究思路和解决方案.

关键词: 大数据, 基元, 数据模型, 分布式文件, 可拓学

Abstract: Big data will have a profound impact on economics, society and life in the near future, and the research on integration and storage of big data may play an important theoretical and practical role in promoting and deepening the application scope of big data. It utilized the data storage structure of the distributed file system named as HBase and the basicelement of Extenics to integrate the heterogeneous data sets, and then stored the processed data set in HBase database. The new data set, which was obtained by extracting the typical characteristics as well as their value of data, especially the semistructured and unstructured data, provides not only a new way for the analysis and interpretation of data but also the research ideas and strategy generation for the professional issues from the perspective of big data.

Key words: big data, basicelement, data model, distributed file, Extenics

[1] 高红, 郭媛媛, 刘行. 基于分合链方法的图的意大利支配数研究[J]. 广东工业大学学报, 2023, 40(02): 1-4.
[2] 陈锦成, 成思源, 杨雪荣. 基于功能需求与可拓理论的专利群规避设计[J]. 广东工业大学学报, 2023, 40(02): 5-14,29.
[3] 王金广, 汤敏聪, 杨振昊, 王昊. 化妆瓶塑料回收处理系统的可拓设计创意生成研究[J]. 广东工业大学学报, 2022, 39(06): 130-140.
[4] 吴嘉健, 杨春燕. TRIZ中流分析的可拓流模型建立方法研究[J]. 广东工业大学学报, 2022, 39(02): 12-18.
[5] 陈美蓉, 江帆, 黄浩翔, 黄海涛, 黄玉琴. 物场-可拓创新方法研究及应用[J]. 广东工业大学学报, 2022, 39(02): 19-25,90.
[6] 王涛, 李文杰. 基于可拓理论的传统民居建筑改造创新设计研究—以北京市房山区宝水村为例[J]. 广东工业大学学报, 2022, 39(02): 26-31.
[7] 陈锦成, 成思源, 杨雪荣. 基于功能分析与可拓理论的再设计方法[J]. 广东工业大学学报, 2022, 39(02): 32-38.
[8] 付晓莉, 仝小冬, 尚会超, 丁同锐, 崔汝晨. 情感化造型基元的拟合模型[J]. 广东工业大学学报, 2022, 39(02): 48-54.
[9] 葛标标, 杨春燕. 科学效应与可拓变换、传导效应的关系研究[J]. 广东工业大学学报, 2021, 38(06): 91-97.
[10] 张紫然, 李兴森, 郭恒发, 王昊. 解决设计问题的可拓创意生成方法——以区庄地铁站地面烟蒂问题为例[J]. 广东工业大学学报, 2021, 38(06): 103-110.
[11] 汪培庄, 曾繁慧, 孙慧, 李兴森, 郭建威, 孟祥福, 何静. 知识图谱的拓展及其智能拓展库[J]. 广东工业大学学报, 2021, 38(04): 9-16.
[12] 李千静, 成思源, 陈晓菁, 杨雪荣, 陈斌. 基于可拓学与CAI技术的无尘黑板专利规避设计[J]. 广东工业大学学报, 2021, 38(02): 20-25,47.
[13] 崔铁军, 李莎莎. 系统故障演化过程的可拓学原理[J]. 广东工业大学学报, 2020, 37(05): 1-6.
[14] 郭恒发, 李兴森, 刘仁湖. 融合可拓学与TRIZ的产品设计创意生成方法——以手机充电器产品设计为例[J]. 广东工业大学学报, 2020, 37(05): 7-12.
[15] 李仔浩, 杨春燕, 李文军. 可拓创新方法在发电机创新设计中的应用[J]. 广东工业大学学报, 2020, 37(01): 1-6.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!