textshape是一整套小的文本重塑和重组功能。 这些功能中的许多功能都来自软件包中的工具。 这使整形工具集于一身,该程序包的特定功能仅限于文本整形。
其他R软件包提供了一些相同的功能。 textshape与这些软件包的不同之处在于, textshape旨在帮助用户获取非结构化数据(或隐式结构化),将其提取为结构化格式,然后重新构建为常见的文本分析格式,以用于文本分析管道的下一阶段。 研究人员通常可以检测/表达看似非结构化数据的隐式结构。 textshape提供了一些工具(例如split_match ),以使研究人员可以将这些隐性知识转换为可用于将数据重新格式化为结构化格式的形式。 该程序包旨在与提供清理和文本规范化功能的程序包一起使用。 此外, 包旨在将各种通用文本数据源导入R以进行重塑和清理。
目录
功能
大多数功能会分割,扩展,抓取或整理vector , list , data.
2021-02-20 16:07:05
716KB
R
1