CodeSnippetSearch
CodeSnippetSearch是一个Web应用程序和一个Web扩展,允许您使用自然语言查询和代码本身搜索GitHub存储库。
它基于使用PyTorch和项目中的数据的单词代码搜索实现的神经袋。 模型培训代码受到CodeSearchNet存储库中基线(Tensorflow)实现的极大启发。 当前,支持Python,Java,Go,Php,Javascript和Ruby编程语言。
有用的论文:
型号说明
模型结构
项目结构
code_search :一个带有脚本的Python包,用于准备数据,训练语言模型并保存嵌入
code_search_web :CodeSnippetSearch网站Django项目
serialized_data :在训练期间存储中间对象(文档,词汇表,模型,嵌入等)
codesearchnet_data :来自CodeSe
1