今天小编就为大家分享一篇Python 比较文本相似性的方法(difflib,Levenshtein),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-05-08 14:41:01 45KB Python 文本相似性
1
基于用户的协同过滤推荐系统 实现一个简单的基于用户的协作过滤推荐系统,以使用给定的数据预测商品的评分。 该预测将使用k个最近邻居和Pearson相关进行。 最后,使用最近的k个邻居的相似性,预测给定用户对新商品的评分 评分文件格式 输入文件每行包含一个评分事件。 每个分级事件的形式为:user_id \ trating \ tmovie_titleuser_id是仅包含字母数字字符,连字符和空格(无制表符)的字符串。 等级是浮动值0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5和5.0之一。 movie_title是一个字符串,其中可能包含空格字符(以分隔单词)。 三个字段(user_id,评价和movie_title)由单个制表符(\ t)分隔。 输入 python Subramanya_Suhas_collabFilter.py rating-datas
2021-04-30 12:02:59 18KB Python
1
这是蛋白质相似性网络-PSIN。 在这里,节点是人类蛋白质,只有在它们具有相当大的序列相似性时它们才被连接。 我们发现该网络对于区分已批准的药物目标和有问题的药物目标特别有用。 在这里,您还可以找到用于此目的的完整程序集和数据集。 免费帮助进一步测试和开发此项目。 非常感谢您的帮助和专业知识! 如有任何疑问,请随时通过论坛或电子邮件与我们联系。 请参阅原始手稿:Lopes,TJS等。 (2015)-“根据目标药物的特征识别有问题的药物”-药理学前沿doi:10.3389 / fphar.2015.00186
2021-04-29 17:05:28 61.85MB 开源软件
1
基于Simhash算法的海量文本相似性检测方法研究
2021-04-18 17:01:32 1.05MB Simhash
1
最近更新 尝试探索的使用。 Mmodel堆叠,TBC .. 更新 注意:此处显示了此项目的更新。但是报告中的模型结果将在2020年12月3日保持不变。 尝试使用句子BERT(Siamese BERT)来改进Model 3,这不比具有暹罗BiLSTM功能的BERT好。 2020.12.15 已尝试ESIM。 2020.12.15 有关重复问题对识别项目的文档 Author: YUAN Yan Zhe, yanzheyuan23@sina.com written on **DEC 3rd, 2020** Collaborators: WEN Ze @WENZe79, YU Jia Hui @YUJIAHUII 项目说明 在自然语言处理(NLP)领域中,文本相似性是一个热点。测量某些NLP子区域中的句子或短语之间的相似性尤其重要,例如对话系统和信息检索。 Quora Question P
1
用于研究纳米团簇(有机体)程序的遗传算法:用于纳米团簇的遗传算法 奥塔哥研究纳米团簇的遗传算法,包括结构方法和相似性(有机体)程序,旨在对纳米团簇进行遗传算法全局优化。 它的设计灵感来自Roy Johnston集团的伯明翰集群遗传算法和伯明翰并行遗传算法(请参阅JBA Davis, A. Shayeghi, SL Horswell, RL Johnston, Nanoscale, 2015,7, 14032 ( 或), RL Johnston,Dalton Trans., 2003, 4193–4207 ( 或 如果您是有机体计划的新手,建议在下载之前通过在交互式Jupyter + Binder交互式页面上运行有机体来尝试一下。 在Jupyter + Binder上,您可以在网络上玩生物程序。 您无需安装任何程序即可在Jupyter + Binder上试用有机体。 单击下面的“活页夹”
2021-04-15 10:40:50 1.10MB Python
1
第三届魔镜杯数据应用大赛数据,数据官方经脱敏处理,
2021-04-02 10:39:44 56.75MB 文本语义相似性
1
迷宫相似 给定一系列迷宫编码为零和一,则确定哪两个迷宫最不相似。 为了解决问题,将迷宫转换为图形并使用深度优先搜索进行遍历,从而产生一系列方向。 通过使用动态编程算法评估每对序列来分析序列相似性,以找到最大的公共子序列。 在这些结果中,选择了具有最低相似度得分的两个迷宫。
2021-04-01 18:09:34 148KB Java
1
根据吕琳媛、周涛《链路预测》中的相似性指标计算示例,参考附录提供的代码分别用python和matlab实现CN、Jaccard、RA指标的计算。并用书中提供了简单的五点的无权无向网络进行测试,结果与作者的计算吻合。 内含文件如下: (1)书中相似性指标计算示例原文 (2)网络的邻接表.txt文件 (3)matlab代码 (4)python代码 (5)python生成的网络图
2021-03-30 13:25:39 566KB Link Prediction python matlab
1
用于跨视图相似性搜索的参数化局部多峰散列
2021-03-28 17:07:15 386KB 研究论文
1