TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2023-04-13 20:23:17 365.48MB 自然语言理解 NLP 机器翻译
1
分享课程——自然语言处理NLP企业级项目课程合集,共包含5门课程,依次是:医疗命名实体识别、火车票识别、新闻文本分类、属性级情感分析、实体关系抽取。3个NLP经典任务,2个真实商业项目。
2023-04-11 18:50:22 428B 自然语言处理
1
自然语言处理 我在这里分享了我在IE Univesity的自然语言处理课程中使用的一些代码。 我也分享我所做的项目。 1.计算歌曲的词汇多样性 我遇到一篇文章,讨论一些音乐家在其职业生涯中的整体词汇。 因此,我想将清单上前3位歌手和最后2位歌手的歌曲与我们在课堂上看到的3首歌曲进行比较。 排在首位的是Eminem(毫不奇怪),他的100首最慢的歌曲中使用了大约8,800个单词。 然后是Jay Z(6,900字)和Tupac Shakur(6,600字)。 排在最末的是Spice Girls和Bruno Mars(大约1500个单词)。 我尝试选择看起来在词汇上更加多样化的歌曲,并且与预期的一样,结果表明两组之间的差异很大,而且与我们看到的三首歌曲相比,差异也很大。 (可以在文件1_Lexical_Diversity中找到该代码) 2.分类模型:真实与否? NLP与灾难鸣叫 我们获得了将近1
2023-04-11 16:46:54 7.42MB JupyterNotebook
1
ChatGPT 作为⼀种强⼤的⾃然语⾔处理模型,已经成为⼈⼯智能领域的重要研究⽅向之⼀。在不断的发展和创新中,ChatGPT 已经具备了很强的⾃然语⾔处理能⼒,其可以实现⾃然语⾔的⽣成、理解和交互,为⼈类的⽣产和⽣活带来了巨⼤的便利和创新。 本书从⼊ 到精通,介绍了 ChatGPT 的基础知识、实现⽅法、进阶应⽤以及最新进展等多个⽅⾯。同时,本书的全部内容均是由 ChatGPT 完成,展现了 ChatGPT 强⼤的能⼒和⼴阔的应⽤前景。通过学习本书,读者可以深⼊了解 ChatGPT 的相关知识和应⽤,掌握 ChatGPT 的实现⽅法,同时也可以了解 ChatGPT 在⼈⼯智能领域的最新进展和未来发展趋势。 随着技术的不断发展和应⽤场景的不断拓展,⼈⼯智能已经成为了当前最具有发展潜⼒的领域之⼀。⼈⼯智能不仅可以为⼈类的⽣产和⽣活带来便利和创新,还可以帮助我们解决⼀些关键性的问题,⽐如环境保护、医疗卫⽣等⽅⾯。同时,⼈⼯智能也带来了⼀些新的挑战和 险, 如数据隐私、伦理问题等 。因此,在推动 智能的发展和应⽤的过程中,我们需要权衡其利弊,并采取相应的措施来规范和引导其发展。
2023-04-06 15:17:38 20.24MB ChatGPT 人工智能 自然语言处理 深度学习
1
通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库
2023-04-05 22:54:11 1.5MB 研究论文
1
基于朴素贝叶斯的垃圾邮件分类系统,详见我的主页博客,有详细介绍,内容很全,经过测试,直接就能跑
1
本项目实现了一套快速有效的语音中英翻译系统,该系统可实现高精度的语音识别、高效双语翻译以及精准的语音合成,可应用于实时翻译场景。系统预先要求用户设置翻译模式,当用户说话时系统进行自动识别及实时翻译,最终,输出语音翻译结果。 该系统提供实时翻译,便于携带。在得到准确高效翻译的同时也节省了人工翻译的成本,无需文字写入读取语音即 可翻译,实现了市场翻译软件的低成本,同时为用户提供多样性的体验模式 本项目调用了百度翻译接口,实现高精度 的语音识别、高效双语翻译以及精准的语音合成。 功能 1.中文→英文实时语音文字翻译 2.英文→中文实时语音文字翻译
1
ChatGPT是一种基于自然语言处理和深度学习技术的聊天机器人,它可以模拟人类的语言行为,与用户进行自然、流畅、富有逻辑的对话。ChatGPT的优点在于它可以快速地进行训练和部署,适用于各种不同的应用场景,如在线客服、智能助手、教育领域等。以下是ChatGPT的一些特点和优势: 基于GPT技术:ChatGPT是基于著名的语言模型GPT(Generative Pre-training Transformer)技术开发的,GPT技术可以让ChatGPT具有更强的语言理解和生成能力,从而实现更加自然、流畅的对话效果。 可扩展性强:ChatGPT可以通过增加训练数据和改变模型结构来实现更好的性能,同时也支持多语言的处理,可以适应不同语言和文化背景的用户需求。 可定制化:ChatGPT可以基于不同的应用场景和需求进行定制,通过人工干预和调参来提高模型的准确性和效率,从而实现更好的用户体验。 智能化:ChatGPT可以通过学习用户的行为和偏好来优化对话,从而实现更加智能化的对话效果,满足用户的个性化需求。
1
基于JAVA开发的BM25排序模型,文件格式为xml。压缩包中含有示例文件xml。
2023-03-29 22:36:17 4.6MB 排序模型 BM25 JAVA 自然语言处理
1
Natual Language Procession.rar 自然语言处理学习包,自己备用需要自取
2023-03-23 19:37:40 175.54MB 自然语言处理 学习 人工智能 nlp
1