- · 《世界最新医学信息文摘[05/29]
- · 《世界最新医学信息文摘[05/29]
- · 《世界最新医学信息文摘[05/29]
- · 《世界最新医学信息文摘[05/29]
- · 《世界最新医学信息文摘[05/29]
中文分词在大数据时代医学领域的应用(2)
作者:网站采编关键词:
摘要:目前在药物研究方面主要面临着药材同物异名的问题,这是地域、时代差异所导致的。这会使分词的准确率降低,无法进行正确的统计和分析。由此需要对
目前在药物研究方面主要面临着药材同物异名的问题,这是地域、时代差异所导致的。这会使分词的准确率降低,无法进行正确的统计和分析。由此需要对同一药材的多个名称进行合并同一处理,不同炮制方法炮制的同一药材被当做两种药材也需要单独标记处理。
3 结语
在这个大数据时代,数据挖掘、自然语言处理是使医学走向信息化、现代化的重要保障,中文分词技术是其基石。充分利用中文分词技术,进行数据挖掘,能够对有心理障碍的人群进行预判和干预,能够从电子病历、临床经验中挖掘出更多有价值的信息,能够推动用药的研究,对医学的应用和研究具有重要的意义,具有广阔的应用前景。正由于中文分词的困难,目前的中文处理技术远远落后于英文的处理,今后还需不断提高中文分词的准确度和速度,使之更好地服务于医学领域。
[1]Kaplan A M,Haenlein M.Users of the world,unite! Thechallenges and opportunities of Social Media[J].Bus inessHorizons,2010(03):59-68.
[2]孟丽,李葆青,胡玲芳,张跃.中文分词技术在社会化媒体分析中的应用[J].中国教育技术装备,2014(16):50-53.
[3]Lin D.An information-theoretic definition of similarity[C].Proc of the 15th IntConf on Machine Learning(ICML’98)San Francisco,CA:Morgan Kaufmann,1998:296-304
[4]SchützeH, for efficient document clustering[C].Procof the 20th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval(SIGIR’97).New York:ACM,1997:74-81
[5]Ramage D,Heymann P,Manning CD, the tagged Web[C].Prof of the 2nd ACM IntConf on Web Search and Data Mining(WSDM’09).New York:ACM,2009:54-63
[6]Freeman R,Yin maps for hierarchical tree view document clustering using contextual information [G].LNCS 2412:Proccof the IEEE Int Joint Conf on Neural :Springer,2002:123-1128.
[7]苏冲,陈清才,王晓龙等.基于最大频繁项集的搜索引擎查询结果聚类算法[J].中文信息学报2010,24(02):58-67.
[8]Beli F,Ester M,Xu term based text clustering [C].Prof of the 8th ACM SIGKDD IntConf on Knowledge Discovery and Data Mining(KDD’02).New York:ACM,2002:436-442.
[9]Fung BCM,Wang K,Ester document clustering using frequent itemsets[C].Prof of the 3rd SIAM IntConf on Data Mining(SDM’03).Phil adelphia,PA:SIAM,2003:59-70.
[10]谢剑,周小茜,童凌,罗凌云.基于中文分词的电子病历数据挖掘技术[J].湖南科技学院学报,2016,37(10):55-59.
[11]张立邦,关毅,杨锦峰.基于无监督学习的中文电子病历分词[J].智能计算机与应用,2014,4(02):68-71.
[12]谢松.中文分词系统在中医药科研中的应用[J].科技创新与应用,2014(33):9-10.
文章来源:《世界最新医学信息文摘》 网址: http://www.sjzxyxxxwz.cn/qikandaodu/2021/0712/1134.html