DFT的matlab源代码MovieLens数据集分析
马修·约翰逊(Matthew
Johnson)
数据集包含4个与电影分级有关的csv文件。
我想探索:
哪些类型与评级趋势或分布最相关?
用户评分习惯(高/低方差,高/低趋势)。
与正面评分与负面评分相关的标签。
预算/工期与评分是否有任何关系?
DataFrame形状:电影:(9125,3),评分:(100004,4),标签:(1296,3),链接:(9125,3)
%
matplotlib
inline
import
numpy
as
np
import
matplotlib
.
pyplot
as
plt
import
pandas
as
pd
import
seaborn
as
sns
movies
=
pd
.
read_csv
(
'movies.csv'
)
ratings
=
pd
.
read_csv
(
'ratings.csv'
)
tags
=
pd
.
read_csv
(
'tags.csv'
)
movies_2
=
pd
.
read_csv
(
'movies_exploded.csv'
)
im
2022-05-20 10:56:23
2.43MB
系统开源
1