NLPCC2016-WordSeg-微博 NLPCC 2016微博分词评估项目 ##任务说明 单词是自然语言理解的基本单元。 但是,中文句子由连续的汉字组成,没有自然的分隔符。 因此,中文分词已成为中文自然语言处理的首要任务,它可以识别句子中单词的顺序并标记单词之间的边界。 与流行的二手新闻数据集不同,我们使用了来自新浪微博的更多非正式文章。 培训和测试数据包含来自各个主题的微博,例如金融,体育,娱乐等。 每个参与者都可以提交三个运行:封闭式运行,半开放式运行和开放式运行。 在封闭的轨道上,参与者只能使用在提供的培训数据中找到的信息。 排除了诸如从外部获得的字数,部分语音信息或姓名列表之类的信息。 在半公开赛道中,除了提供的训练数据之外,参与者还可以使用从提供的背景数据中提取的信息。 排除了诸如从外部获得的字数,部分语音信息或姓名列表之类的信息。 在公开赛道上,参与者可以使用应该
1
这是Trigram语言模型的实现。 用法: (先决条件:您需要在计算机上安装python版本3才能运行此程序) 将corpus.zip解压缩(使用“在此处提取”)到项目结构的根目录。 使用python3执行main.py。 (例如:python /main.py) 请按照控制台上的说明进行操作。
2023-05-10 18:48:12 7.06MB Python
1
声纳自定义规则示例 该存储库包含您可以直接克隆的项目示例,以引导您自己的项目,以编写针对COBOL,Java,JavaScript,PHP,Python和RPG的自定义规则。 有相关文档: : 执照 版权所有2016-2019 SonarSource。 根据
2023-04-25 20:08:35 93KB language-team Java
1
The C++ Programming Language 英文第4版2013年的, 中文第3版. pdf格式
2023-04-24 07:27:28 61.94MB C++ Programming Language cn3ed
1
易语言核心支持库文本操作汇编版源码,核心支持库文本操作汇编版,更新信息,lstrcpyn,CharUpperA,CharLowerA,lstrlenA,GetProcessHeap,RtlAllocateHeap,lstrcmp
1
Office Open XML Part 1 - Fundamentals And Markup Language Reference 处理word/ppt/Excel的格式文档,开发office软件,处理或者兼容office软件的参考文档
2023-04-16 14:44:26 40.64MB Office open
1
推特情绪分析器 在推文上执行情感分析后,搜索推文并提供详细报告的Web应用程序。 应用程序位于
1
C程序设计语言第二版《英文版》,每个学习C语言人必读的经典著作。
2023-04-14 11:00:24 1.17MB The C Programming Language(2nd
1
go语言一起简洁而著称,在性能、内存开销、静态类型、对异步的处理、可调试性、系统稳定度、工具链的成熟度方面都有很好的表现。由Go语言核心团队成员Alan A. A. Donovan和K&R中的 Brian W. Kernighan合作编写了Go语言方面的经典教材《The Go Programming Language》能够让我们慢慢领会到go语言的精彩。 go序 go语言的权威资料可以参考go语言官方网站。 go语言提供一个web运行的go语言环境playground。 书中的代码可以在gopl.io上查找,也可以通过go get命令获取。 书中的习题代码可以参考torbiak $ expor
2023-04-13 08:41:40 41KB go语言 IN min
1
Training language models to follow instructions论文精读 速速了解InstructGPT
2023-04-11 12:31:49 1.78MB 人工智能 gpt
1