查看工具(查看窗口句柄标题等):用于查看窗口的句柄、标题等信息的工具;有人传了个别人写的工具要3分,看不过去了。
2021-09-28 21:43:16 300KB 窗口 句柄 标题 Caption
1
Image caption 数据集链接-附件资源
2021-09-17 18:04:19 106B
1
图像字幕生成 InceptionV3-多层GRU(Keras和TensorFlow) 要求: Python 3.6 TensorFlow 1.13.1(安装tensorflow-1.13.1-cp36-cp36m-win_amd64.whl) 凯拉斯2.2.4 Joblib 1.0.1 Matplotlib 3.3.4 Open CV 4.5.1 熊猫1.1.5 Nltk 3.5 下载Flickr30k或MSCOCO数据集图像和标题。 训练模型的步骤: 克隆存储库以保留目录结构。 对于Flickr30k放在flickr30k图像文件夹或MSCOCO results_20130124.token和Flickr30k图像放captions_val2014.json和MSCOCO图像COCO-images文件夹中。 通过运行以下python keras2tensorflo
2021-09-04 17:16:28 63.06MB JupyterNotebook
1
GDI算法实战 渐变背景框
2021-08-06 17:02:00 48.56MB mfc
1
视听视频字幕 这是我通过使用pytorch框架使用MSR-VTT数据集为视频字幕构建的项目,该框架涉及视觉和音频信息。 视频的视觉内容被预处理成固定数量的帧,馈入经过预训练的深度CNN(例如,ResNet 152)以提取特征,并馈入LSTM编码器。 对于音频内容,它们被预处理为MFCC,并馈入另一个LSTM编码器。 然后,将两个LSTM编码器的输出和隐藏状态通过平均池化(或多级注意,以及子总和单元 )进行组合,然后进一步馈入LSTM解码器以生成字幕。 整个项目的基本结构是从导入的。 要运行该项目,您需要以下依赖项: Python3 运行模型的步骤 第一步是预处理视频和字幕 $ python preprocess.py --video_dir path/to/the/training/video/directory --output_dir path/to/the/features/
2021-07-05 19:33:19 99.52MB Python
1
Conceptual Caption Dataset is provided by Google Research. 概念标题数据集由谷歌研究工作室提供。 conceptualcaption_Validation_GCC-1.1.0-Validation_datasets.tsv conceptualcaption_Train_GCC-training_datasets.tsv conceptualcaption_Image_Labels_Subset_Train_GCC-Labels-training_datasets.tsv
2021-06-17 22:19:25 751.89MB 数据集
1
图像字幕生成器 使用CNN和RNN生成图像标题
2021-05-31 15:59:50 25.52MB JupyterNotebook
1
keras首次加载vgg16模型的时候,会先下载该模型模型已经预训练好的模型权重文件。使用keras下载速度着实令人着急,有需要用的朋友自取。
2021-05-28 22:27:51 489.97MB image-caption vgg16预训练模型权重.h5文
1
Tensorflow实现:图像描述---Show and Tell: A Neural Image Caption Generator-附件资源
2021-05-12 22:20:45 106B
1
数据集下载链接:https://www.imageclef.org/photodata 请把数据集放在:程序neural_image_captioning\datasets\中 完整工程:图像描述---Show and Tell: A Neural Image Caption Generator,使用keras实现图像描述,运行环境(keras==2.0.3,tensorflow==1.1.0,pandas==0.19.1,numpy==1.12.1,h5py==2.7.0,matplotlib==2.1.0,pillow==4.3.0)
2021-04-10 19:39:35 171.88MB imagecaption
1