上传者: 38685831
|
上传时间: 2021-11-30 16:39:57
|
文件大小: 139KB
|
文件类型: -
lt码的解码matlab代码信息论-作业1
第1部分:源代码
从课程网站获取thesis.txt。
此ASCII文件包含来自字母az和空格的N
=
344026个字符。
假设这个长度是已知的。
对于算术编码,文件结束符的概率为零,直到字符N
=
344026之后,文件结束符的概率为1。
编程说明:要回答此问题,您将需要编写计算机程序。
但是,您将无需实现甚至运行实际的压缩系统来计算所讨论的系统的性能。
检查:这部分内容相对简单(如果不是,请与我会面)。
但是,您确定数字答案正确吗?
如果您的数字与我的数字不完全一致,我想知道为什么。
您的代码是否对一个或两个字符的琐碎文件给出了正确答案?
您的概率分布总和为一吗?
没有检查证据的错误答案可能会使该零件获得零分。
1.字符统计:编写计算机程序以读取文件并计算字母表中每个字母出现的次数。
归一化这些计数将得出从文件中随机选择的字符的概率分布p(xn)。
计算此分布的熵H(Xn),并将其以位为单位报告给3个有效数字。
2.二元组统计:计算对应于从前(N
-1)个字符中随机均匀选择一个字符xn的相邻字符对P(xn,xn
+
1)的分布,并读取下