KeyBERT:使用BERT进行最少的关键字提取-源码

上传者: 42133861 | 上传时间: 2021-09-22 21:15:31 | 文件大小: 77KB | 文件类型: ZIP
基伯特 KeyBERT是一种最小且易于使用的关键字提取技术,它利用BERT嵌入来创建与文档最相似的关键字和关键字短语。 相应的媒体帖子可以在 找到。 目录 2.1。2.2。2.3。2.4。2.5。 1.关于项目 尽管已经有很多方法可用于关键字生成(例如 , ,TF-IDF等),但我想创建一种非常基本但功能强大的方法来提取关键字和关键字。这就是KeyBERT进来的地方!它使用BERT嵌入和简单的余弦相似性来查找文档中与文档本身最相似的子短语。 首先,使用BERT提取文档嵌入,以获得文档级表示。然后,针对N元语法词/短语提取词嵌入。最后,我们使用余弦相似度来查找与文档最相似的词/短语。然后,可以将最相似的词识别为最能描述整个文档的词。 KeyBERT绝不是唯一的,它是一种用于创建关键字和关键词的快速简便的方法。虽然有许多伟大的论文和解决方案,在那里,使用BERT-嵌入物(如, , ,

文件下载

资源详情

[{"title":"( 26 个子文件 77KB ) KeyBERT:使用BERT进行最少的关键字提取-源码","children":[{"title":"KeyBERT-master","children":[{"title":".gitattributes <span style='color:#111;'> 31B </span>","children":null,"spread":false},{"title":".github","children":[{"title":"workflows","children":[{"title":"testing.yml <span style='color:#111;'> 608B </span>","children":null,"spread":false}],"spread":true}],"spread":true},{"title":"images","children":[{"title":"icon.png <span style='color:#111;'> 21.21KB </span>","children":null,"spread":false},{"title":"logo.png <span style='color:#111;'> 35.84KB </span>","children":null,"spread":false}],"spread":true},{"title":"keybert","children":[{"title":"model.py <span style='color:#111;'> 14.29KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 56B </span>","children":null,"spread":false},{"title":"maxsum.py <span style='color:#111;'> 2.21KB </span>","children":null,"spread":false},{"title":"mmr.py <span style='color:#111;'> 2.28KB </span>","children":null,"spread":false}],"spread":true},{"title":"theme","children":[{"title":"style.css <span style='color:#111;'> 0B </span>","children":null,"spread":false}],"spread":true},{"title":"mkdocs.yml <span style='color:#111;'> 1.04KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"setup.py <span style='color:#111;'> 1.77KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 9.34KB </span>","children":null,"spread":false},{"title":"Makefile <span style='color:#111;'> 329B </span>","children":null,"spread":false},{"title":"docs","children":[{"title":"index.md <span style='color:#111;'> 3.89KB </span>","children":null,"spread":false},{"title":"guides","children":[{"title":"embeddings.md <span style='color:#111;'> 1.16KB </span>","children":null,"spread":false},{"title":"quickstart.md <span style='color:#111;'> 4.02KB </span>","children":null,"spread":false}],"spread":true},{"title":"api","children":[{"title":"maxsum.md <span style='color:#111;'> 62B </span>","children":null,"spread":false},{"title":"mmr.md <span style='color:#111;'> 52B </span>","children":null,"spread":false},{"title":"keybert.md <span style='color:#111;'> 39B </span>","children":null,"spread":false}],"spread":false},{"title":"style.css <span style='color:#111;'> 0B </span>","children":null,"spread":false}],"spread":true},{"title":"tests","children":[{"title":"utils.py <span style='color:#111;'> 1.90KB </span>","children":null,"spread":false},{"title":"test_model.py <span style='color:#111;'> 3.48KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"conftest.py <span style='color:#111;'> 176B </span>","children":null,"spread":false}],"spread":true},{"title":".gitignore <span style='color:#111;'> 916B </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明