一个大数据解决方案需要面对三个关键问题:大数据的存储、大数据的分析和大数据的管理。首先综述了大数据和Hadoop生态系统的定义;然后从商业产品和Hadoop生态系统两个方面来探讨如何面对大数据,重点分析了Hadoop生态系统是如何解决的:分别用HDFS、HBase和OpenTSDB解决存储问题,用Hadoop MapReduce(Hive)和HadoopDB解决分析问题,用Sqoop和Ganglia等解决管理问题。对于每个成员,分别分析了其系统架构、实现原理和特点;对于重点成员,分别分析了其存在的一些问题或缺点,并在总结当前学术和应用的进展基础上,结合我们自身的研究进展,提出了解决方法、解决思路和观点。可以预见,Hadoop生态系统将是中小企业在面对大数据问题时的首选解决方案。
2021-11-20 16:38:46 619KB hadoop
1
背景介绍 建了仓库,地址在这里: 点star不迷路,相关文章在github上更新的会更交替一点QAQ 之前做过调整的命名体识别,项目背景实际上也很简单,就是我要做一个关键词匹配的功能,第一步我需要挖掘关键词。 ,明星领域,财经领域等等吧,这些领域的文本很有特色,一般人名/地名/公司名称/书名/电影名称都可以很好的表示文本关键信息。 在这种项目背景之下,很自然的就会想到使用命名体识别。我把在做这个项目的过程中,积累的一些资料汇总了一下,希望对大家有所帮助。 关于命名体识别,这是一个很大的领域,要做好,有很多工作要做。标题完全是为了能增加曝光,自己还是知道只是一个小学生,我会把自己看过的有用的东西都列出来,给大家提供一些先验信息。 之后看到的关于nert的文章会在此基础继续更新(最近存了好多新文章还没看/苦逼码农/ QAQ),不过建议大家star一下Github,不迷路,我给自己的计划是精读一
2021-11-20 14:11:54 4KB 系统开源
1
NULL 博文链接:https://lvdccyb.iteye.com/blog/1328125
2021-11-20 10:59:59 149KB 源码 工具
1
知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
1
计算机外设接口技术发展综述 ISA 总 线 外 设 控 制 接 口 技 术 PCI 总 线 外 设 控 制 接 口 技 术 USB 接 口 IEEE 1394 总 线 EDA 工 程 和EDA 工 具 ASIC 专 用 集 成 电 路 设 计
2021-11-19 19:49:45 101KB 计算机 结构
1
文献综述 基于J ava 的超市系统设计与实现 一前言部分 管理信息系统MIS 是一个由人计算机等组成的能进行信息的收集传递存储加工和使用的 系统MIS 不仅能够及时全面地提供信息和数据简化系统工具对不同的管理层提出不同的报告还能 根据过去的数据预测未来的情况 当代社会正在由传统的工业化社会向信息化社会过渡信息已成为人类社会的重要资源信息处理技 术和信息利用能力也成为衡量一个国家社会发达程度和科
2021-11-19 08:45:32 382KB 文档 互联网 资源
某办公楼综合布线系统设计综述,很实用的东西哦
2021-11-18 20:49:57 382KB 综合布线系统设计
1
生成式对抗网络(Generative Adversarial Networks,GANs)作为近年来的研究热点之一,受到了广泛关注,每年在机器学习、计算机视觉、自然语言处理、语音识别等上大量相关论文发表。密歇根大学Jie Gui博士等人近期发布了《A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications》,包括28页pdf,这篇综述论文对460余篇论文进行了尝试从算法,理论和应用的角度对各种GANs方法进行叙述。
2021-11-18 20:13:29 1.74MB GANs
1
深度学习的CT图像降噪 01.使用方向小波进行低剂量X射线CT重建的深层卷积神经网络(KAIST-net) 数据集 AAPM-Mayo诊所低剂量CT大型挑战赛(仅腹部CT图像) 512x512,10位患者,5743个切片 使用55x55补丁 模型 该方法适用于低剂量CT图像的小波系数 网络包含24个卷积层 02.通过卷积神经网络进行小剂量CT 数据集 TCIA(癌症影像档案馆)常规剂量的CT图像。 256x256、165位患者,7015个切片。 将泊松噪声加到正常剂量的正弦图中。 使用33x33的补丁。 模型 网络仅使用3个层(Conv-ReLU-Conv-ReLU-Conv)。 03.使用残差卷积网络改善低剂量CT图像 数据集 AAPM-梅奥诊所低剂量CT挑战赛 512x512,10位患者,5080个切片 使用44x44补丁(2D),44x44x24补丁(3D) 模型 二
2021-11-18 19:12:59 1.16MB
1
本文来自于网络,本文主要介绍了目标检测可以实际应用的生活场景以及目标检测的主要问题和深度学习的方法等相关知识。这或许是计算机视觉领域内最著名的问题。它主要指将一张图像归为某种类别。学术界最流行的一类数据集是ImageNet,由数以百万计已分好类的图像组成,(部分)用于年度ImageNet大规模视觉识别挑战比赛(ILSVRC)。近年来,分类模型已经超过了人类的表现,因此该问题基本算是一个已经解决的问题。图像分类领域有许多挑战,但是也有许多文章介绍已经解决了的,以及未解决的挑战。图分类样例与分类类似,定位问题是找到图像中单一物体的位置。图目标定位示例目标定位在实际生活中是很有用的。例如,智能裁
1