肿瘤康复网,内容丰富有趣,生活中的好帮手!
肿瘤康复网 > 什么是文本分析 文本分析主要运用到了哪些关键技术?

什么是文本分析 文本分析主要运用到了哪些关键技术?

时间:2023-08-29 12:31:43

相关推荐

文本分析是指:

从文本中抽取特征词进行量化以表示文本信息。

文本一般指文字。

它是自然语言处理的一个小分支,自然语言处理还包括语音识别(常见的)等。

目的:

先决条件:将无结构化的原始文本转化为结构化的,计算机可以识别和处理的信息。

优势特点:从而可以利用机器学习,分类聚类等算法,对文本进行分析处理。

关键环节:对文本进行抽象,建立数学模型,用来描述和代替文本。

应用场景:处理后的文本就是高度抽象和特征化的,可以实现广告推荐,舆情监测等。

关键技术:

1、用向量空间模型描述文本。将非结构化文本转化为结构化。

为什么不用词频统计和分词算法,是因为这两种方法得到的特征向量维度非常大,后期矢量处理开销非常大,不利于后期分类、聚类。

主流方法是用特征词来表示文本,特征词必须满足:能识别文本内容、去区分其它文本、个数不能太多、容易实现。

特征词选取后,必须有相应的权值表示不同的影响,最好对其进行排序。

2、特征词选取的四种方式:

用映射或者转换的方法将原始特征变为较少特征。

在原始特征中挑选出具有代表性的特征。

根据专家挑选最优影响力的特征。

利用数学模型,找出最具分类型的特征。这种方式最客观,最精确。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:

什么是文本挖掘?大数据该挖掘什么?

/article-13833-1.html

大数据时代,文本、语义和社交分析,未来市场将走向何方

/article-2467-1.html

基于深度神经网络,是怎么自动生成文本摘要的

/article-1306-1.html

多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

如果觉得《什么是文本分析 文本分析主要运用到了哪些关键技术?》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。