/*程序用途:按行读取常见 (包括ANSI、UNICODEUNICODE big endian、UTF-8)格式的文本文件 */ //核心算法:CStdioFileEx继承自CStdioFile, 覆盖CStdioFile的 BOOL ReadString(CString& rString)方法, // 根据不同文件编码特征,寻找文件回车换行符判断读取行结束,文件结束符判断文件结束 // 检测不同文件编码头部,获取文件类型后调用不同的读取函数 //测试结果:在Windows7 VS2008环境下测试上述四种格式的txt文件通过 //尚未完成:未重载CStdioFile的 virtual LPTSTR ReadString( LPTSTR lpsz, UINT nMax )方法 // 未完成WriteString方法,未在VC UNICODE 环境下的测试
2021-11-03 18:58:06 8.12MB CStdioFileEx
1
mmi_chset_ucs2_to_gb18030_str
2021-11-03 10:37:03 1.48MB unicode GB18030
1
"SAKURA" is a Japanese text editor for MS Windows. Japanese MS Windows 95/98/NT/2000/XP/Vista is required. Most double-byte characters are not shown properly on other language versions of MS Windows.
2021-10-31 23:39:24 1.81MB Sakura
1
UNICODE2ANSI.exe是UNICODE码和ANSI码两种编码转换工具。说编码转化可能很多朋友还不是很明白,但是如果说起插入数据库的一句话“”的加密代码“┼攠數畣整爠煥敵瑳∨≮┩>”,相信很多朋友都有所耳闻。它就是一个转换这2种编码的一个小工具。
2021-10-30 17:34:20 110KB ANSI码
1
OpenType功能冻结器 使用 ,您可以将某些OpenType功能“冻结”为一种字体。 然后,这些功能会“默认情况下处于启用状态”,因此,即使在不支持OpenType功能的应用程序中(例如LibreOffice,OpenOffice和Windows XP),以前只能通过OpenType功能访问的字符(例如小写字母,旧式数字或本地化形式)现在也可以访问。或在不支持特定功能的应用中(例如Microsoft Office(如果使用小写字母))。 注意:该工具实际上通过应用指定的GSUB功能来重新映射字体的cmap表。 如果字形都没有任何cmap条目,则替换将不起作用。 仅支持单个和替代替换。
2021-10-30 17:06:29 77.62MB font opentype opentype-features opentype-fonts
1
Sentiment_analysis_twitter 总览 分析表情符号在改善情感分析结果中的作用。 使用Twitter StreamAPI收集Twitter数据,并使用TF-IDF对推文进行矢量化处理。 使用矩阵创建一个正向和负向矢量,并使用余弦相似度来确定给定推文为正或负的程度。 通过转换unicode将Emoji表情合并到推文中,并重复该过程。 将过程分类提高了15%。 动机 了解人类的情感和理智向来是我的痴迷。 借助我的数据科学技能,我想了解人们如何在社交网络上表达情感,也就是情感分析。 作为一个狂热的Twitter用户,我知道限制少于140个字符如何迫使人们进行创新,以及表情符号如何
2021-10-30 10:41:59 34.11MB emoji nlp machine-learning tweets
1
iconfont 可以替换iconfont文件 查看图标编码
2021-10-28 20:01:10 130KB Iconfont Unicode
1
纯C语音进行各种格式编码直接的转换。 int gbk_to_unicode int unicode_to_gbk int unicode_to_utf8 int utf8_to_unicode
2021-10-27 21:56:28 88KB c utf8 unicode gbk
1
NULL 博文链接:https://272426068.iteye.com/blog/1190946
2021-10-27 11:30:04 5KB 源码 工具
1
CJKV Information Processing 中日韓越資訊處理 中日韩越资讯处理
2021-10-27 10:06:13 56.56MB 字体 UNICODE CJK
1