Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliability, efficiency, and maintainability. In addition, we have an overwhelming variety of tools, including relational databases, NoSQL datastores, stream or batch processors, and message brokers. What are the right choices for your application? How do you make sense of all these buzzwords?, In this practical and comprehensive guide, author Martin Kleppmann helps you navigate this diverse landscape by examining the pros and cons of various technologies for processing and storing data. Software keeps changing, but the fundamental principles remain the same. With this book, software engineers and architects will learn how to apply those ideas in practice, and how to make full use of data in modern applications., Peer under the hood of the systems you already use, and learn how to use and operate them more effectively, Make informed decisions by identifying the strengths and weaknesses of different tools, Navigate the trade-offs around consistency, scalability, fault tolerance, and complexity, Understand the distributed systems research upon which modern databases are built, Peek behind the scenes of major online services, and learn from their architectures
2023-01-14 00:48:58 23.82MB database programming
In this practical and comprehensive guide, author Martin Kleppmann helps you navigate this diverse landscape by examining the pros and cons of various technologies for processing and storing data. Software keeps changing, but the fundamental principles remain the same. With this book, software engineers and architects will learn how to apply those ideas in practice, and how to make full use of data in modern applications.
2023-01-14 00:44:44 15.76MB 大数据 分布式 架构设计 系统设计
KITTI数据集基准、转换成tum以及十个groundtruth对应图的文章链接: 跑vins-fusion的时候,不知道使用的kitti数据集的基准,并且不知道怎么使用 这个资源整理了kitti数据集raw data的基准groundtruth,并且给出了kitti转tum的结果,方便进行对比。 1、poses(00-10) 2、times(00-10) 3、转成tum(00-10) 4、对应数据集轨迹图(00-10) 5、数据集sequence对应
2023-01-13 15:47:33 3.54MB kitti vins groundtruth
数据压缩导论 第五版 数据压缩导论 第五版 数据压缩导论 第五版
2023-01-12 22:58:04 10.41MB 数据压缩 data compression
信息论及数据压缩算法的介绍。 information theory,probability coding,applications of probability coding,LZ77,78, Burrows Wheeler,fractal compression.......
2023-01-12 22:55:58 377KB 数据 算法
此脚本为输入的相位偏移阵列(以秒为单位)提供给定 tau 值的修正艾伦偏差估计值。 通过在艾伦偏差计算之前平均相邻相位值的预滤波技术,大大减少了修改后的艾伦偏差计算的运行时间。 Griggs, E., ER Kursinski, and D. Akos (2015), Short-term GNSS 卫星时钟稳定性, Radio Sci., 50、doi:10.1002/2015RS005667。
2023-01-11 20:20:43 3KB matlab
很棒的学术数据分析 学术数据分析的资源清单,包括数据集,论文和有关文献计量学,引文分析的代码以及其他学术共享资源。 可在线访问 目录 隶属关系 高度度量和尺寸 工具 发布数据集和分析的用户界面 收集开放获取文件的工具 研究论文分类工具 可视化 语言处理和信息提取 引文和元数据提取 出版地点 期刊 专题会议 工作坊 暑期学校 协会与社区 会费 用markdown-toc生成的目录 数据集 出版与引文 Arnet矿工 微软学术图 打开学术图-MAG + AMiner OpenAIRE研究图-在此处了解更多信息 语义学者语料库 CiteSeer 考研 用于引用字符串解析的CORA数据集 人文和多语言引文字符串解析Flux-CiM和ICONIP ,有关详细信息,请参见Neural ParsCit论文 社会科学对英语和德语引文的引文字符串解析数据-与Grobid和Cermine的比较 Cro
2023-01-09 09:12:21 19KB
zabbix_clear_data zabbix_clear_data 线上zabbix数据增长比较快,一不小心个别表就40多G,历史监控数据对公司业务没有多大用,就搞了个定时清理,节约一些磁盘空间,一切只是为了省省省~! 注:示例表id请在数据库表结构建立后自行新增。
2023-01-06 09:11:07 12KB Shell
基于随机平滑的数据中毒防御有多强健? 抽象的 可证明可靠的分类器的预测在一个点附近保持不变,从而使它们在保证测试时间的情况下具有弹性。 在这项工作中,我们提出了对健壮的机器学习模型的前所未有的威胁,突显了训练数据质量在实现高认证健壮性方面的重要性。 具体而言,我们提出了一种基于双层优化的新型数据中毒攻击,该攻击会降低可证明的鲁棒分类器的鲁棒性保证。 与其他数据中毒攻击会降低一小组目标点上的中毒模型的准确性不同,我们的攻击会减少数据集中整个目标类的平均认证半径。 此外,即使受害者使用最新的健壮训练方法(例如, 和从头开始训练模型,我们的攻击也是有效的。 为了使攻击更难检测,我们使用带有明显较小失真的干净标签中毒点。 通过中毒MNIST和CIFAR10数据集并使用前面提到的鲁棒训练方法训练深度神经网络,并使用随机平滑验证其鲁棒性,来评估所提出方法的有效性。 对于使用这些强大的训练方法训练的模型
Kimball 经典著作,对DW/BI项目开发流程控制的详细解读。
2023-01-05 18:16:38 8.78MB Data Warehouse