堆叠去噪自编码器matlab代码微型计算机
(线性)边际化堆叠降噪自动编码器(mSDA)以及密集词组(dCoT)的Python实现,这是基于mSDA的降维算法。
基于Minmin
Chen的Matlab代码。
有关原始论文和代码,请参见。
该代码尚未经过广泛的测试,因此实际上请不要依靠它来产生正确的表示形式。
继续关注此存储库以保持最新。
减少文字尺寸的用法示例:
from
linear_msda
import
mSDA
#
load
your
corpus,
should
be
bag
of
words
format
(as
in
e.g.
gensim)
preprocessed_bow_documents
=
MmCorpus
(
"test_corpus.mm"
)
#
load
your
dictionary
id2word
=
Dictionary
(
"..."
)
dimensions
=
1000
#
select
prototype
word
IDs,
e.g.
by
finding
the
most
frequent
terms
prototype_ids
=
[
2022-01-29 10:47:11
16KB
系统开源
1