数据分析与知识发现
    主页 > 期刊导读 >

医学教育与医学边缘学科论文_非均衡数据分类

文章摘要:近年来,人工智能技术被广泛地运用于多个领域。其中,智慧医疗场景得到了普遍关注,并产生了大量临床辅助诊断和医疗方案推荐的实际应用。然而,由于人工智能技术的本质在于通过从大量真实数据中进行模式抽取,从而预测未知情况,因此真实数据的数据特征和数据质量将直接影响人工智能应用的效果。相比其他的智能应用领域,由于罕见病患者在人群中总是占极少数,医疗数据具有天然的非均衡的特点,而高度非均衡的数据在机器学习领域被认为是难于学习的。针对这一应用现状,文中首先围绕“数据非均衡”问题开展了文献调研,尝试通过寻找该问题的通用解决办法来指导在智慧医疗环境下的应用。之后,以数据挖掘领域的会议SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)近年发表的涉及非均衡数据集的工作为分析样本,统计针对特定领域的“数据非均衡”问题人们倾向选择的处理方法。最后,通过医学数据分析中的两个典型应用场景,对调研获得的知识和方法进行实验应用,从而验证了调研和统计分析中得出方法的可用性。

文章关键词:数据分析,智慧医疗,非均衡数据集,过采样,

论文作者:江昊琛1 魏子麒1 刘璘1 陈俊2 

作者单位:2. 百度公司 

论文分类号: R-05;TP311.13

相似文献:不平衡数据集分类方法综述.....作者:王乐,韩萌,李小娟,张妮,程浩东,刊载期刊:《计算机工程与应用》
改进欠抽样方法及其在非平衡数据集分类应用.....作者:牛壮,李凤莲,张雪英,樊宇宙,魏鑫,刊载期刊:《计算机工程》
紧邻类与小类数据集下的模糊聚类有效性指标.....作者:耿嘉艺,钱雪忠,周世兵,刊载期刊:《计算机应用研究》
检务文书检索数据集的构建.....作者:王佳麒,杨沐昀,赵铁军,赵臻宇,刊载期刊:《山东大学学报(理学版)》
检务文书检索数据集的构建.....作者:王佳麒,杨沐昀,赵铁军,赵臻宇,刊载期刊:《山东大学学报(理学版)》
面向智慧康养的数据集构建方法及其应用.....作者:张麟宇,涂志莹,杭少石,张柏林,初佃辉,刊载期刊:《计算机科学与探索》
多数据集深度学习模型的修图处理识别.....作者:杨滨,陈先意,刊载期刊:《计算机科学与探索》
基于相关性分析的指挥信息系统模拟数据集可用性评估算法.....作者:田相轩,李军旗,金丽亚,刘正仁,石志强,刊载期刊:《兵工学报》
相同敏感值数据集的隐私保护泛化算法.....作者:郑明辉,吕含笑,段洋洋,刊载期刊:《郑州大学学报(理学版)》
一种解决命名实体识别数据集类别标记失衡的方法.....作者:许丽丹,刘嘉勇,何祥,刊载期刊:《四川大学学报(自然科学版)》

相关文章:“百年毓医书香传承”医学人文阅读推广服务.....作者:王丽丽;刘培波;刘贺
大数据的技术创新和应用—以人口普查为例.....作者:冯乃林
大数据融合应用技术框架与行业应用.....作者:段飞虎
大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉
基于大数据的知识共享与协同创新.....作者:顾新建
敦煌莫高窟文化遗产数字化保护——数字敦煌.....作者:夏生平
从医学社会史的角度看瘟疫.....作者:余新忠
新冠疫情的医学人文透视.....作者:王一方