PHP文字统计 PHP Text Statistics类将帮助您确定与网站内容有关的问题,尤其是与可读性有关的问题。 它使您可以使用常见的评分系统来衡量文本的可读性,其中包括: Flesch Kincaid阅读轻松 Flesch Kincaid年级 冈宁雾分数 科尔曼廖氏指数 SMOG指数 自动可靠性指数 Dale-Chall可读性得分 Spache可读性得分 衡量文本可读性的最大挑战之一是音节的计数,这可能很难计算。 Statistics类中有一些规则可用于计算单词的音节计数,还有大量单词可用于测试这些规则。 请随时添加到测试单词列表中,尤其是当您发现未正确计算音节计数的单词时(尤其是如果您还可以将代码添加到类中以便正确处理您的单词时,尤其如此)。 同形异义词将无法计算,因为它们取决于上下文(例如,“他在房子周围拖着脚踏车”,“她骑着脚踏车上学”),但是这些东西很少,不用担心。
2022-12-11 10:16:57 102KB PHP
1
:green_book: py可读性指标 使用流行的可读性公式和指标对文本的可读性进行评分,包括: , , , , , , Linsear Write , SMOG和SPACHE 。 :green_book: 安装 pip install py-readability-metrics python -m nltk.downloader punkt 用法 from readability import Readability r = Readability ( text ) r . flesch_kincaid () r . flesch () r . gunning_fog () r . coleman_liau () r . dale_chall () r . ari () r . linsear_write () r . smog () r . spache () *注意: text必须包含> = 100个字*
1