WordStat 内容分析和文本挖掘软件对比

软服之家基于其丰富和专业的的软件数据库,为您提供多个软件在基础信息、功能配置、参考价格、软件界面、特色优势、典型客户、供应商等方面的对比,帮助您选择合适的软件。 本次参与对比的软件包括: WordStat 内容分析和文本挖掘软件
 

icon基础信息

功能分类 KMS知识管理/情报分析 Office/文档编辑 数据统计与分析 - - -
产品简介

WordStat是一种灵活且易于使用的文本分析软件–无论您是需要文本挖掘工具来快速提取主题和趋势,还是需要使用更新的定量内容分析工具进行仔细而精确的测量。任何需要快速从大量文档中提取和分析信息的人都可以使用WordStat。我们的内容分析和文本挖掘软件可用于许多应用程序,例如开放式响应分析,商业智能,新闻报道的内容分析,欺诈检测等。

- - -
制造商StataCorp LLC - - -
原产地美国 > 得克萨斯州 - - -
授权方式 - - - -
发布时间2022年 - - -
详情
查看详情 > 
- - -

icon功能配置

功能模块 - - -
展开 

icon参考价格

价格- - - -

icon软件界面

界面 - - -

icon特点优势

特点

1、从许多来源导入,WordStat允许您从许多来源直接导入多语言内容:

(1)导入文档: Word,PDF,HTML,PowerPoint,RTF,TXT,XPS,ePUB,ODT,WordPerfect。
(2)导入数据文件: Excel,CSV,TSV,Access
(3)从统计软件导入: Stata,SPSS
(4)从社交媒体导入: Facebook,Twitter,Reddit,YouTube,RSS
(5)从电子邮件导入: Outlook,Gmail,MBox
(6)从网络调查中导入: Qualtrics,SurveyMonkey,SurveyGizmo,QuestionPro,Voxco,Triple-S
(7)从参考管理工具中导入: Endnote,Mendeley,Zotero,RIS
(8)导入图形: BMP,WMF,JPG,GIF,PNG。自动提取与这些图像相关的任何信息,例如地理位置,标题,描述,作者,评论等,并将其转换为变量
(9)从XML数据库导入
(10)ODBC数据库连接可用。
(11)从定性软件导入项目: NVivo,Atlas.ti,Qdpx文件
(12)导入和分析多语言文档,包括从右到左的语言
(13)监视特定的文件夹,并自动导入存储在此文件夹中的所有文档和图像,或监视对原始源文件或联机服务的更改。

2、整理数据

(1)多种功能使您可以通过使分析过程简单明了的方式轻松组织数据:
(2)快速分组,标记,排序,添加,删除文档或查找重复项。
(3)使用“文档转换向导”手动或自动将变量分配给您的文档,即:日期,作者或人口统计数据,例如年龄,性别或位置。
(4)轻松地对变量进行重新排序,添加,删除,编辑和重新编码。
(5)根据变量值过滤大小写。


3、使用资源管理器模式快速提取含义

(1)使用资源管理器模式可以快速,轻松地从大量文本数据中提取含义,这是专门为那些文本挖掘经验很少的人设计的。
(2)使用主题建模工具,找出最常用的单词,短语并提取文档中最重要的主题。在任何时候,您都可以切换到专家模式,从而可以使用所有WordStat的功能。


4、使用文本挖掘浏览文档内容

(1)在几秒钟内,探索大量非结构化数据的内容并提取有见地的信息:
(2)提取最常用的单词,短语,表达方式。
(3)在单词或短语上使用聚类或2D和3D多维缩放快速提取主题。
(4)使用邻近图轻松识别与目标关键字同时出现的所有关键字。
(5)使用链接分析功能探索单词或概念之间的关系。
(6)通过应用关键字同时出现条件(在一个案例中,一个句子,一个段落,一个n个单词的窗口,一个用户定义的片段)以及聚类方法(一阶和二阶接近度,选择)来微调分析相似性指标)。 使用分层聚类,多维缩放,链接分析和邻近图来探索概念或文档之间的相似性。

7、使用主题建模来提取最突出的主题

(1)通过将自然语言处理和统计分析(NNMF或因子分析)结合使用,不仅对单词而且对短语,都可以使用最新的自动主题提取功能,从大型文本集中快速浏览最重要的主题和相关单词(包括拼写错误)。
(2)在层次聚类分析中,一个单词可能仅出现在一个聚类中,主题建模可能导致一个单词与多个主题相关联,这一特征更现实地表示了某些单词的多义性以及该单词的多个上下文单词用法。

8、探索联系

(1)使用网络图探索单词或概念之间的联系。使用三种布局类型检测共现的基础模式和结构:多维缩放,基于力的图形和圆形布局。
(2)图是交互式的,可用于探索关系并检索与特定连接关联的文本段。

9、使文本与结构化数据相关

(1)探索非结构化文本与结构化数据之间的关系:
(2)识别时间趋势,子组之间的差异,或使用统计和图形工具(偏差表,对应分析,热图,气泡图等)评估与等级或其他类别或数字数据的关系。
(3)使用不同的关联度量来评估单词出现与名义或有序变量之间的关系:卡方,似然比,Tau-a,Tau-b,Tau-c,对称Somers\'D,非对称Somers\'Dxy和Dyx,Gamma,Person\'s R,斯皮尔曼的Rho。


10、使用字典对文本数据进行分类

(1)使用现有词典实现全文分析自动化,或者创建您自己的单词和短语分类模型。
(2)在字典中,可以实现布尔(AND,OR,NOT)和接近度规则(NEAR,AFTER,BEFORE)并使用正则表达式公式快速从文本数据中提取特定信息。
(3)字典调节的词法修饰和词干支持多种语言,并且自动单词替换选项使您可以用目标关键字替换多个单词。用户定义的停用词列表可用多种语言提供,以避免不必要的常用词(例如他,她,它等)在分析中使用。

11、获得独特的词典构建帮助

通过提取常用短语和技术术语以及在文本集合中快速识别拼写错误和相关单词(同义词,反义词,全名,同义词,上位词,下位词)的工具,获得真正独特的计算机协助,以建立分类标准。

12、使用机器学习自动对文本数据进行分类

(1)使用朴素贝叶斯和K-Nearest邻居开发和优化自动文档分类模型。用户可以选择多种验证方法:留一法,n折交叉验证,分割样本。实验模块可用于轻松比较预测模型和精细分类模型。

(2)分类模型可以保存到磁盘中,并稍后在QDA Miner中的独立文档分类实用程序,命令行程序或编程库中应用

13、一键返回原始文档

(1)通过使用关键字检索或上下文中的关键字来检索句子,段落或整个文档,从几乎所有功能,图表或图形中返回文本,从而验证或深入分析。这在建立分类法或消除词义歧义时特别有用。
(2)检索到的文本段可以按关键字或任何自变量排序。您可以将QDA Miner代码附加到检索到的段上,或以表格格式(Excel,CSV等)或文本报告(MS Word,RTF等)将其导出到磁盘。

14、执行定性编码

将WordStat与最新的定性编码工具(QDA Miner)结合使用,以便在需要时更精确地浏览数据或对特定文档或提取的文本段进行更深入的分析。

15、将非结构化文本转换为交互式地图(GIS映射)

将非结构化文本数据与地理信息相关联,并创建数据点,主题地图和热图的交互式图表,以及用于将位置名称,邮政编码和IP地址转换为纬度和经度的地理编码Web服务。

16、自动提取名称和拼写错误

自动提取命名实体(名称,技术术语,产品和公司名称),可以使用简单的拖放操作将其添加到分类字典中。
拼写错误和未知单词会自动提取出来,并与用户词典中的现有条目匹配,并且可以迅速添加到词典中。

17、汇出结果

将文本分析结果导出为常见的行业文件格式(例如Excel,SPSS,ASCII,HTML,XML,MS Word),流行的统计分析工具(例如SPSS和STATA)以及图形(例如PNG,BMP和JPEG)。

18、使用Python脚本转换文本

使用Python脚本及其全部开放源代码库来预处理或转换文本文档,以便在WordStat中进行分析。

- - -
展开 

icon典型客户

客户- - - -

icon软件供应商

供应商- - - -

注:软件功能配置信息仅供参考,实际功能配置信息以真实软件为准,解释权归软件制造商所有。