图片字幕 介绍 建立一个模型以从图像生成字幕。 给定图像后,模型可以用英语描述图像中的内容。 为了实现这一点,我们的模型由一个编码器(一个CNN)和一个解码器(一个RNN)组成。 为CNN编码器提供了用于分类任务的图像,其输出被馈送到RNN解码器,后者输出英语句子。 该模型及其超参数的调整基于论文和。 我们使用微软Çommon在CO NTEXT(MS COCO)O bjects为这个项目。 它是用于场景理解的大规模数据集。 该数据集通常用于训练和基准化对象检测,分段和字幕算法。 有关下载数据的说明,请参见下面的“数据”部分。 代码 该代码可以分为两类: 笔记本-该项目的主要代码由一系列Jupyter笔记本构成: 0_Dataset.ipynb介绍数据集并绘制一些样本图像。 1_Preliminaries.ipynb加载和预处理数据并使用模型进行实验。 2_Training.ip
2023-01-02 13:00:14 2.09MB nlp computer-vision cnn pytorch
1
这是 ShowMeAI 持续分享的速查表系列!本系列速查表包含 200 多张知识卡片,分为『计算机科学』『机器学习』『计算机视觉和深度学习基础』『计算机视觉和深度学习精选专题』4个主题,用以回顾多年的 ML 研究、课程和学习中的所有内容,并为机器学习工程师的面试做准备。 这个文件是『计算机科学』主题(其他部分的下载链接见评论区),包含以下部分: PL Fundamentals(PL基础知识) Data Structures & Algorithms(数据结构和算法) Bit Manipulations(位操作) Time/Space Complexity(时间/空间复杂度)
1
全景OpenCV 从stitch_final.py的文档中 用法:pythonitch_final.py -dest <目标文件名.jpg> 用法: (例子) : 请将存储库克隆到工作文件夹。 执行以下命令 pythonitch_final.py images / destination.jpg 它将询问是否要修剪或旋转,请按照给定的指示进行操作。 图像将显示并保存到给定的目的地。 [理论等稍后添加]-维护中的回购...! 上班的人,是吗? :)
2022-12-21 21:18:28 5.69MB opencv machine-learning image computer-vision
1
每个像素都很重要:域自适应对象检测器的中心感知特征对齐 该项目托管用于实现“ (ECCV 2020)的代码。 介绍 域自适应对象检测器旨在使其自身适应可能包含对象外观,视点或背景变化的不可见域。大多数现有方法都在图像级别或实例级别采用特征对齐。但是,全局特征上的图像级别对齐可能会同时纠缠前景/背景像素,而使用提案的实例级别对齐可能会遭受背景噪声的困扰。 与现有解决方案不同,我们提出了一种域自适应框架,该框架通过预测逐像素的对象度和中心度来考虑每个像素。具体而言,所提出的方法通过更加关注前景像素来进行中心感知对齐,从而实现跨域更好的适应性。为了更好地跨域对齐要素,我们开发了一种中心感知的对齐方法,该方法可以进行对齐过程。 我们在众多的适应性设置上展示了我们的方法,并获得了广泛的实验结果,并针对现有的最新算法展示了良好的性能。 安装 检查以获取安装说明。 我们的无锚检测器的实现很大程度上基于F
1
Computer Organization and Design, The Hardware/Software Interface的第五版的习题答案,第六章,英文版原书,彩色的,比中文版清晰。
2022-12-15 15:17:40 1.8MB Computer Organization and Design
1
11-The CISSP Prep Guide Mastering the Ten Domains of Computer Security by Ronald L-1st Edition-2001年-501页
2022-12-11 12:00:51 5.49MB CISSP
1
Structure and Interpretation of Computer Programs (second edition) 麻省理工官方网页版全本,下载解压即可通过浏览器浏览,高清无水印,绝对准确无误。本书的好就不多说了,用来学习绝对没问题。
2022-12-05 07:14:59 1.17MB Lisp经典教材
1
计算机网络_自顶向下方法(英文第6版) 《计算机网络:自顶向下方法(原书第6版)》第6版继续保持了以前版本的特色,为计算机网络教学提供了一种新颖和与时俱进的方法,同时也进行了相当多的修订和更新:第1章更多地关注时下,更新了接入网的论述;第2章用python替代了java来介绍套接字编程;第3章补充了用于优化云服务性能的tcp分岔知识;第4章有关路由器体系结构的内容做了大量更新;第5章重新组织并新增了数据中心网络的内容;第6章更新了无线网络的内容以反映其最新进展;第7章进行了较大修订,深入讨论了流式视频,包括了适应性流和cdn的讨论;第8章进一步讨论了端点鉴别;等等。另外,书后习题也做了大量更新
2022-12-04 22:28:25 9.01MB 网络
1
Rotation+Transforms+for+Computer+Graphics
2022-12-02 00:40:19 7.1MB Computer Graphics
1
此仓库是AWESOME摄影测量项目,应用程序,工具和资源的集合。 标有的项目 是开源软件,并链接到源代码。 标有的项目 是非免费的,可能需要花钱才能使用。 随意贡献/加星/分叉/拉取请求。 任何建议和意见是值得欢迎的。 目录 科学会议 相关真棒列表 执照 致谢 定义 根据K. Schindler和W.Förstner的摄影测量学定义: “摄影测量学是从图像中获取有关物理环境信息的科学技术,重点是在测量,制图和高精度计量学中的应用。摄影测量学的目的是为这些工程任务提供自动化或半自动化的程序,着重于指定的准确性,可靠性和信息完整性。” 资料来源:K. Schindler和W.Förstner的摄影测量(2020)。 于:《计算机视觉:参考指南》,第二版。 摄影测量软件 Agisoft变形 麦克麦克 MVE OpenDroneMap Pix4D 现实捕捉 确保
1