CodeSnippetSearch CodeSnippetSearch是一个Web应用程序和一个Web扩展,允许您使用自然语言查询和代码本身搜索GitHub存储库。 它基于使用PyTorch和项目中的数据的单词代码搜索实现的神经袋。 模型培训代码受到CodeSearchNet存储库中基线(Tensorflow)实现的极大启发。 当前,支持Python,Java,Go,Php,Javascript和Ruby编程语言。 有用的论文: 型号说明 模型结构 项目结构 code_search :一个带有脚本的Python包,用于准备数据,训练语言模型并保存嵌入 code_search_web :CodeSnippetSearch网站Django项目 serialized_data :在训练期间存储中间对象(文档,词汇表,模型,嵌入等) codesearchnet_data :来自CodeSe
1