数据分析与知识发现
    主页 > 期刊导读 >

行政学及国家行政管理论文_档案学视角下区域政

文章目录

摘要

ABSTRACT

第一章 绪论

1.1 选题背景及依据

1.2 研究价值与意义

    1.2.1 本研究的理论价值

    1.2.2 本研究的应用价值

1.3 国内外研究现状

    1.3.1 国内外文献的计量分析

    1.3.2 区域政务社交媒体相关研究

    1.3.3 政务微博的知识发现研究

    1.3.4 档案学视角下的知识发现研究

    1.3.5 研究现状的总结

1.4 研究方法与技术路线

    1.4.1 研究方法

    1.4.2 技术路线

1.5 研究内容与创新点

    1.5.1 研究内容

    1.5.2 本研究的创新点

第二章 理论基础与技术体系

2.1 研究对象与相关概念

    2.1.1 研究对象

    2.1.2 相关概念

2.2 理论依据

    2.2.1 档案学相关理论

    2.2.2 图书馆学、情报学相关理论

2.3 核心技术体系

    2.3.1 中文自然语言处理

    2.3.2 本体与知识组织

    2.3.3 知识地图

2.4 本章小结

第三章 档案层次关联理论的整合与描述

3.1 档案学理论整合的依据与思路

    3.1.1 理论整合的环境——档案学范式的融合

    3.1.2 理论整合的原因——实践活动提出的要求

    3.1.3 理论整合的基础——原始理论间的相容性

    3.1.4 理论整合的方式——基于层次维度的形式化描述

3.2 档案学理论整合的具体方案

    3.2.1 理论整合方案的提出依据

    3.2.2 档案学理论的整合与形式化描述

3.3 档案层次关联理论的指导作用

    3.3.1 界定信息描述与本体构建的基本要素

    3.3.2 尊重不同层级实体间的固有联系

    3.3.3 指导区域政务社交媒体资源的层次化整理

3.4 本章小结

第四章 区域政务微博知识发现模型的构建

4.1 模型构建的基本思路

4.2 微博文本的存档与预处理

    4.2.1 区域政务微博的存档

    4.2.2 微博文本的预处理

4.3 微博文本的主题聚类

    4.3.1 LDA模型简述

    4.3.2 政务微博主题聚类的实现方式

4.4 基于实体关系的文本信息单元抽取

    4.4.1 信息单元抽取概述

    4.4.2 分词与词性标注

    4.4.3 命名实体识别与句法分析

    4.4.4 微博信息单元抽取的实现方式

4.5 基于应用本体的政务微博知识地图构建

    4.5.1 应用本体构建的思路与方法

    4.5.2 本体构建的核心要素定义

    4.5.3 应用本体构建与知识地图实现

4.6 区域政务微博知识发现模型的基本架构

4.7 本章小结

第五章 区域政务微博知识发现模型的实证与应用

5.1 实验环境

5.2 数据收集与预处理

    5.2.1 数据收集

    5.2.2 数据降噪处理

5.3 LDA主题建模与文本聚类

    5.3.1 基于专题的微博文本聚类

    5.3.2 基于事件的微博文本聚类

5.4 政务微博文本的信息单元抽取

5.5 区域政务微博知识地图构建

    5.5.1 本体要素的实例化与实体关系构建

    5.5.2 基于OntoGraf的区域政务微博知识地图实现

5.6 结果评价与讨论

    5.6.1 本次实验的合理方面

    5.6.2 本次实验的不足之处

    5.6.3 实验结果的理论探讨

5.7 本章小结

第六章 结语

6.1 本文的主要工作

6.2 研究局限与展望

参考文献

攻读硕士学位期间取得的科研成果

致谢

文章摘要:利用政务微博这一社交媒体平台发布区域政务信息、倾听社情民意已成为我国地方国家机关政务信息活动的重要形式,相应地,地方机关通过微博平台提供的政务信息服务使得用户能够迅速知晓、概览本地重要新闻与热点事件,并从中汲取信息、获取知识。伴随着用户的信息阅读方式由全文化转变为碎片化,以从全文中提炼出的信息单元或知识单元为基本要素聚合而成的知识地图在节省读者时间、提高读者知识吸收效率方面具有重要价值。基于以上两点,同时为尊重信息单元与知识单元的来源关系、保证知识组织与知识发现的质量,本文提出了一种档案学视角下的区域政务微博知识发现模型,旨在对具有文件、档案属性的政务信息资源进行知识化开发,方便用户的知识吸收与利用,进而提升地方国家机关的政务信息知识服务水平。首先,本文对区域政务微博、档案信息资源的知识发现、社交媒体文件等核心概念进行了阐释,并对国内外相关研究进行了综述与总结,指出了本文在研究过程中的理论依据与应用的核心技术体系。其次,以档案学应用理论为基础,融合图书情报学的理论成果对经典档案学理论进行了有机整合与六元组形式的描述,阐明了其在知识组织与知识发现过程中的价值。再次,基于整合的档案学理论,借助以LDA主题建模和依存句法分析为核心的自然语言处理技术与以应用本体构建为核心知识组织技术,完成了区域政务微博知识发现模型的构建工作,确立了“原文本数据-聚类数据-信息单元-知识地图”的数据挖掘与知识开发流程。最后,以西安市为区域实例,以“专题-事件”为微博内容类别的划分标准,利用爬虫软件采集相关微博文本进行实证分析,以知识地图作为知识发现的可视化成果,结果表明本文整合、构建的理论与模型在实践层面具有一定的可行性。本文构建的档案学视角下区域政务微博的知识发现模型能够在一定程度上为区域内政务信息资源的整合与开发利用提供帮助,同时帮助用户提高知识识别与利用效率。然而,本文在理论整合的合理性、知识组织与知识发现的精度与深度、实验的信度与效度方面还存在较大的改进与提升空间,以深度学习为基础实现知识的动态表征与推理、增强全模型的智能化水平是其后的主要研究方向。