自然语言处理 我在这里分享了我在IE Univesity的自然语言处理课程中使用的一些代码。 我也分享我所做的项目。 1.计算歌曲的词汇多样性 我遇到一篇文章,讨论一些音乐家在其职业生涯中的整体词汇。 因此,我想将清单上前3位歌手和最后2位歌手的歌曲与我们在课堂上看到的3首歌曲进行比较。 排在首位的是Eminem(毫不奇怪),他的100首最慢的歌曲中使用了大约8,800个单词。 然后是Jay Z(6,900字)和Tupac Shakur(6,600字)。 排在最末的是Spice Girls和Bruno Mars(大约1500个单词)。 我尝试选择看起来在词汇上更加多样化的歌曲,并且与预期的一样,结果表明两组之间的差异很大,而且与我们看到的三首歌曲相比,差异也很大。 (可以在文件1_Lexical_Diversity中找到该代码) 2.分类模型:真实与否? NLP与灾难鸣叫 我们获得了将近1
2023-04-11 16:46:54 7.42MB JupyterNotebook
1
OCR 框 Tesseract 培训“盒装”。 只需上传一些字体并运行它! 用法 将字体(目前仅支持 TTF)放入/opt/ocrbox/fonts 从/opt/ocrbox目录运行bin/train 新的语言文件将安装到/opt/tessdata并留在/opt/ocrbox 使用bin/clean重置一切(建议在更改训练集时使用) 训练步骤 bin/train执行以下操作: 读取字体列表 在每个上运行text2image以生成 tif/box 文件 在每个 tif/box 对上训练 Tesseract 为所有框生成 unicharset 文件 运行实际训练 语言 bin/train脚本默认为eng作为语言 - 您可以通过编辑文件顶部的变量来更改它。 字体名称 大多数字体似乎采用FontFamilyName-VariantBits格式,但有些不是! 我们实际上使用了一个合适的 T
2023-04-05 18:12:55 474KB Shell
1
ply las pcd等一些常见的基本点云文件格式的读写方法。 有详细的python和C++代码实现,希望和大家一起学习。
2023-04-04 14:50:24 23KB python 点云 pcd ply
1
一些开发用的比较老的软件软盘版本 BC3.1 VB3.0 Win3.1 汉字系统等等
2023-04-03 20:36:46 490.04MB disk
1
uni-app一些工具类
2023-04-03 01:10:39 23KB 软件/插件
1
简介 自用,佛系维护,有需求请自行编译ACRH17,竞斗云,ARMv8使用immortalwrt-18.06-k5.4源码R2S使用lean-lede原始默认LAN IP:192.168.2.1默认用户名root,密码password 设备 R2S,竞斗云,ACRH17,ARMv8通用版本 主要特点 代理插件五合一:SSRP,Passwall,vssr,Bypass,Openclash(预先核心) 去广告:Adguardhome,dnsfilter,godproxy(魔改自koolproxy) UPnP,网易云解锁,smartdns,https-dns-proxy,argon主题 鸣谢 提供: 精益: CTCGFW源码:
2023-04-01 21:54:04 37KB luci openwrt-actions Shell
1
Pandoc配置和支持文件 描述 与Pandoc一起使用的支持文件的集合,专门用于帮助将pandoc markdown文件转换为漂亮HTML,LaTeX和PDF输出。 这些文件位于~/.pandoc/文件夹中,旨在与 , 和提供的样式和配置材料一起使用。 但是,唯一真正的依赖项是中的latex类和样式文件。 PDF格式 HTML 单词 笔记 包括什么? PDF(vita LaTeX),HTML或Microsoft Word中的文章的某些模板。 这些放在~/.pandoc/templates 。 这些可以通过--template=开关直接指向。 latex.template和xelatex.template取决于的样式文件。 Word参考文档取决于您安装了Myriad Pro和Minion Pro。 在R中,knitr的knit()函数会将.Rmd文件转换为.md文件。 knitr/
2023-04-01 00:11:58 822KB TeX
1
cmake-templates:一些CMake模板(示例)。 Qt,Boost,OpenCV,C ++ 11等
2023-03-28 21:43:40 201KB opencv qt cmake example
1
Grails_Architecture Grails零件的高级分解: UrlMappings:将来自视图,js或单独的前端的传入URL指向控制器。 控制器:用于路由,渲染(视图/字符串)和调用服务,也许可以进行一些轻量级参数检查*。 您的业​​务逻辑不应该在这里。 服务:您的业务逻辑应该在哪里,以及您应该在哪里操作域对象。 视图:从控制器渲染,以返回html,json等。 域:这些是数据源的表示形式,通常是SQL表或NoSql对象。 它们中可以包含约束逻辑,但是不要太过费力,添加应该在您的服务中添加的其他功能和逻辑。 命令对象:在这里可以进行广泛的参数检查。 它们就像域对象,但没有持久性。 命令对象目前除了实现Validateable特性外没有其他约定,可用于绑定控制器中的传入参数。 我实际上已经编写了一个插件,该插件为他们提供了更多约定,而我只是想将其包含在Grails插件
2023-03-27 20:34:38 314KB
1
js-selector 基于原生js封装的一些简单选择器 ####大致可以分下面几种情况讨论 - 简单的id/class/tagName选择器,并且参数中不含特殊字符(" ",">"), 就是平常的document.getElement.... - 匿名方法function(){},就丢给[removed] = function(){}处理 - 含有" "的,就是下代选择器,先把当前元素取出来,再取出它的子集元素 - 含有">"的,就是亲子代选择器,同样先把当前元素取出来,再取出它的子 集元素,同时要保证它的子集元素的父节点就是当前节点才能通过 ####API 我们可以使用下面几种选择器 $s("#test-id") $s(".test-class") $s("p") $s(".test-children #children2 .children2-1") $s(".test-ch
2023-03-27 12:45:26 5KB JavaScript
1