随着大数据时代的到来,数据分析和机器学习已经成为许多领域不可或缺的一部分。而在这些领域中,数据集是进行训练和测试的重要资源。为了方便数据分析和机器学习项目的开发,已经有许多公开的数据集资源可以供大家免费使用。 在这些公开的数据集资源中,Kaggle、UCI机器学习存储库、Google 数据集搜索、AWS 公开数据集、数据集之家、数据堂、数据派等资源提供了大量涵盖不同领域和不同规模的数据集,涉及到的领域包括但不限于自然语言处理、计算机视觉、社交网络分析、金融、医疗等。 这些数据集的使用可以帮助数据科学家和机器学习从业者更好地进行训练和测试,提高模型的准确性和鲁棒性。同时,这些数据集也可以为初学者提供一些实践的机会,帮助他们掌握数据分析和机器学习的相关技能。 因此,数据科学领域资源汇总:数据集搜索平台+机器学习+公开数据集+为数据分析和机器学习项目提供免费数据资源的主题非常适合用于数据科学和机器学习的毕业设计,让学生们有机会深入研究和使用这些公开数据集资源,探索数据分析和机器学习的更多可能性。
2023-06-15 18:08:59 2KB 数据集 机器学习 数据分析
1
机器学习 – 机器学习项目案例 案例1:利用岭回归研究波士顿放假 读取数据 from sklearn.datasets import load_boston boston = load_boston() print('feature_names:', boston.feature_names) print('data (shape) :', boston.data.shape) 线性回归模型 from sklearn.linear_model import LinearRegression lin_reg = LinearRegression() lin_reg.fit(boston.da
2023-05-19 15:41:59 302KB data test 学习
1
这里采用沪深300指数数据,时间跨度是2010年10月10号至今,选择每天的最高价格。假设当天最高价依赖当天的前n(如30)天的沪深300的最高价格。用LSTM模型来捕捉最高价的时序信息,通过模型训练,使之学会用前n天的最高价,来判断当天的最高价。
2023-04-16 20:26:26 88KB LSTM
1
本项目通过python实现验证码识别,包括数据集制作,模型训练,测试等。 pip install -i https://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.com opencv-python==3.4.3.18 1、是cut.py切割成单个字符【已完成可跳过】 2、label.py将字符图片标上标签,其实就是手动标注的,也可以自己手动标注【已完成可跳过】 3、train.py用来训练模型,查看准确度 4、test.py用来查看效果,测试 自制数据集过程: 1、切割成单个字符,需要将cut.py和train文件夹放到同一个目录下,视频中在edu-cut文件夹里实验,运行cut.py自动分割。因为目录里的train文件夹是分割好的,分割好的放到char文件夹里,继续第二步。 2、当有了train和char文件夹后,开始标注图片。将label.py和train和char文件夹放在edu-label目录下,运行label.py,看弹出图片是什么就输入什么,一个个标注好即可
1
Customer-segmentation:用于银行客户细分的无监督机器学习项目
2023-03-25 23:20:46 809KB JupyterNotebook
1
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:08 24KB 深度学习 机器学习 项目
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:07 96KB 深度学习 机器学习 项目
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:06 2.09MB 深度学习 机器学习 项目
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:05 1.64MB 深度学习 机器学习 项目
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:05 11.23MB 深度学习 机器学习 项目