标题生成 在数字媒体世界中,每天都有数百万条新闻在争夺读者的眼球,头条新闻在引导读者找到合适的内容时起着重要的作用。 因此,一些发行商被激励创建带有误导性内容的标题,以引起读者的注意。 因此,开发一种自动标题生成系统,该系统可以提供文章的真实和翔实的标题,就成为一个严峻的挑战。 本文研究了不同的抽象文本摘要框架,包括2000年引入的统计模型和2020年建立的基于Transformer的深度学习模型,以了解这些方法的优点和局限性。 我们对该项目的贡献包括:1)在最近发布的数据集NewSHead上实施和评估这些模型,以及2)试用新的预训练和自适应策略以改进基于变压器的编码器-解码器模型。
2021-12-17 23:33:59 44.14MB JupyterNotebook
1
MusicStyleTransfer 音乐风格转换使我们可以将一种音乐风格表现为另一种音乐风格。 这项工作侧重于古典和爵士风格。 介绍 观察神经网络在其他领域的成功,我们的目标是从音乐中产生有趣的结果。 音乐从根本上说是一系列音符。 作曲家会构造长音符序列,然后通过乐器进行演奏以产生音乐。 通过听音乐,人们可以轻松识别音乐的流派。但是,很难对音乐的风格进行参数化设置,因为它不依赖于诸如音高,人声等任何固定指标,而是取决于音乐的组成和性能。被关联。 尽管音乐流派(古典,爵士等)取决于听众,但每种流派都有一定的区别特征。 生成模型可用于原则上更改现有数据的属性,甚至在数据样本之间转移属性。在本报告中,我们旨在了解不同音乐流派的风格,并通过属性转移将一种音乐风格转换为另一种音乐风格。 我们通过生成对抗网络(GAN)和序列-序列模型(Seq-Seq)展示了各种方法与所得音乐作品之间的比较。 方法
2021-12-17 22:08:42 117.13MB JupyterNotebook
1
酒点和机器学习 在葡萄平均生长季节(3月至8月)的每个月中,使用温度(低,高,平均),降水,湿度和阴天来预测葡萄酒的得分。 使用多元线性回归,支持向量回归和神经网络。 结论 下次提供更多时间: 更多小尺寸类别 更大的数据集 更加多样化的天气数据(即污染) 包括其他地区(即法国或其他国家) 更多的葡萄酒包含更多的积分 调查葡萄酒品种 其他要考虑的因素: 气候 技术 环境因素(污染,土壤养分等) 藤龄
2021-12-17 19:06:09 58.73MB JupyterNotebook
1
匈牙利算法第5号 用于二部图的匈牙利匹配算法的实现,包括顶点权重。
2021-12-17 15:59:42 17KB JupyterNotebook
1
伊菲姆 iFEM是一个MATLAB软件包,其中包含健壮,高效且易于遵循的代码,用于二维和三维二维非结构化简单网格上的自适​​应有限元方法的主要构建模块。 除了简单性和可读性之外,还引入了稀疏矩阵化(一种针对MATLAB的创新编程风格),以提高效率。 在这种新颖的编码方式中,稀疏矩阵及其运算被广泛用于数据结构和算法中。 安装 通过以下任一方法将iFEM的路径添加到MATLAB的路径库中: 图形界面。 单击文件->设置路径->使用子文件夹添加,然后选择存储软件包iFEM的目录。 命令窗口。 转到iFEM的目录并运行setpath 帮助 help funexample显示功能funexample的描述和语法。 例如, help mg将在纯文本中显示mg功能的基本用法。 ifem funexampledoc显示详细说明。 例如, ifem mgdoc将以html格式逐步解释mg功能。 但是,
2021-12-17 15:19:51 27.44MB JupyterNotebook
1
星巴克分析:预测某人是否会响应报价。 目录 项目动机 我很好奇如何通过使用星巴克数据集找到客户想要的首选商品。 描述 公司向客户发送要约时面临的主要问题之一是公司不知道客户会优先选择哪个要约。 因此,公司发出报价时不知道客户想要什么报价。 该项目预测报价是否由单个客户响应。 这意味着公司可以实施此预测,以帮助公司找到单个客户首选的报价并正确发送报价。 该项目实现了XGBoost分类器和星巴克数据集来训练模型。 该项目实现了XGBoost分类器和星巴克数据集。 星巴克数据集包括投资组合,配置文件和成绩单数据集。 这些数据集用于训练XGBoost模型。 安装 XGBoost需要安装。 conda install -c conda-forge xgboost 在读取文件之前,请运行命令conda update pandas 。 为了使熊猫正确读取transcript.json文件。 并
2021-12-17 10:40:28 7.3MB JupyterNotebook
1
COVID_analysis 这是一个研究COVID-19数据集的项目,我们通过查看以下4个主要主题细分了加利福尼亚的COVID-19统计信息:性别造成的病例和死亡以及不同种族的病例和死亡种族和种类的死亡和死亡年龄和死亡的年龄
2021-12-17 05:32:19 2.94MB JupyterNotebook
1
比赛天池_新闻推荐 天池大赛-新闻推荐场景下的用户行为预测挑战赛,SOLO赛,B榜排名5/5338 解决方案 召回方案 使用热度召回,改进itemCF,分配Swing和item2vec进行多路召回,结合faiss库计算相似文章尝试解决冷启动问题,采用贝叶斯优化选择最优超参数,最终每个用户召回50篇文章。 排序方案 建立用户行为和文章自身特征,根据召回结果按照1:5划分正负样本转化为CTR预测问题,采用lightGBM进行5折交叉验证,根据转化概率得到文章的结果,最终HR @ 5达到0.27,HR @ 50达到0.49。
2021-12-16 23:40:37 68KB JupyterNotebook
1
红酒质量项目 关于这个项目 这两个数据集与葡萄牙“ Vinho Verde”葡萄酒的红色和白色变体有关。 有关更多详细信息,请参考参考文献[Cortez等,2009]。 由于隐私和物流问题,仅物理化学(输入)和感官(输出)变量可用(例如,没有有关葡萄类型,葡萄酒品牌,葡萄酒售价等的数据)。 数据源 目标 创建一个可以有效预测葡萄酒总体质量(好坏)的模型 数据字典 酒精度-葡萄酒中酒精度的百分比。 氯化物-葡萄酒中盐的含量。 柠檬酸-葡萄酒中的柠檬酸含量。 含量低会增加“新鲜度”和风味。 密度-葡萄酒的密度。 固定酸度-葡萄酒的固定酸度。 游离二氧化硫-葡萄酒中存在的游离二氧化硫水平。 is_good_wine-布尔值列,反映葡萄酒是劣质(质量1-5)还是“好”(质量6-10)。 (0 ==不好,1 ==很好) pH-描述葡萄酒的酸性或碱性程度从0(非常酸性)到14(非常碱性)
2021-12-16 23:38:08 735KB JupyterNotebook
1
GAN研究 研究生研究项目,使用CycleGAN和其他生成模型探索图像到图像的翻译。
2021-12-16 18:20:41 2.07MB JupyterNotebook
1