CCF-BDCI-Sentiment-Analysis-Baseline 1.从该中改写的 2.该模型将文本截成k段,分别输入语言模型,然后顶层用GRU拼接起来。好处在于设置小的max_length和更大的k来降低显存占用,因为显存占用是关于长度平方级增长的,而关于k是线性增长的 模型 线上F1 Bert-base 80.3 Bert-wwm-ext 80.5 XLNet-base 79.25 XLNet-mid 79.6 XLNet-large -- Roberta-mid 80.5 Roberta-large (max_seq_length=512, split_num=1) 81.25 注: 1)实际长度 = max_seq_length * split_num 2)实际batch size 大小= per_gpu_train_batch_size * numbers of gpu
2021-11-17 19:34:01 1.03MB Python
1
中国计算机学会通讯(2020年2月期),其中的专题以区块链、联盟为核心而产生多篇高价值的文章。专栏部分包括:AIoT时代的智能无线感知、科研模式与评估体制、知识图谱的下半场:机遇与挑战等。欢迎大家下载学习。
2021-11-17 09:46:30 22.22MB CCF
1
2017-CCF-BDCI-Enterprise 这是我的第一个数据挖掘比赛,CCF 大数据与计算智能大赛(BDCI)中的一题:。最终取得复赛 A 榜第 3,B 榜第 9 (Top 1.58%) 的成绩。 这个比赛 12 月中旬就结束了,硬是被我拖到现在才来总结,我这拖延症真的是……现在回忆起这个比赛,比赛时的那种郁闷感依然记忆犹新。我在复赛的第 5 天便达到了分数 6924,但之后一直无法提分,这种烦躁感当时给我带来了挺大的困扰(当然最后还是提升到了分数 6930)。等比赛结束之后,我回过头来看,其实当时我参赛的心态是不端正的,功利心太强,这样带来的问题就是比赛心态的爆炸,自己的眼界会被约束,提分方式的想象力也会被限制。最好的心态应该是抱着学习的心态参赛,只要能够学到一点点新的东西,就会感到惊喜。 另外一个想说的点是,我们团队在复赛 A 榜中排名第 3,但是切换 B 榜之后,便跌到第 9
2021-10-27 09:53:53 21KB data-mining ccf binary-classification 2017
1
PAKDD - 2019 includes the whole of accepted papers. 包含CCF C类会议(PAKDD)在2019年录用的论文集。
2021-10-26 09:49:46 93.75MB PAKDD CCF_C
1
转自CCF,网址:https://dl.ccf.org.cn/lecture/lectureDetail?id=3914354153457664 摘要:全球互联网正在从IT时代走向DT时代, Hadoop作为大型互联网企业存储数据的核心产品,存有大量企业敏感数据。但是,Hadoop在设计之初没有过多考虑安全性问题,造成安全功能不完善,存在很多安全风险。而同时,众所周知的是,在企业敏感信息泄露事件中,内部人员泄露占有很高的比例。随着大型互联网业务规模迅猛增长,企业一方面要应对日益激增的数据量,另一方面还需打造更加安全的技术体系,避免海量数据泄露。因此大数据体系的安全挑战十分巨大。
2021-10-23 18:26:06 3.46MB CCF 滴滴出行 数据安全 大数据
1
CSP 2020 入门组初赛第一轮试题B卷
2021-10-01 16:03:55 2.99MB CSP CCF
1
CSP 2019 入门组初赛第一轮试题
2021-10-01 16:03:54 3.05MB CSP CCF
1
CSP 2018 入门组初赛第一轮试题
2021-10-01 16:03:54 2.32MB CSP CCF
1
此资源为CCF全国信息学奥林匹克联赛(NOIP2018)普及组复赛试题,资源并没有题解,可以让其他人独立思考。
2021-09-29 14:52:46 626KB C++ C Pascal
1
CCF CSP 计算机软件能力认证第1-10次真题,从2013年的模拟题到2014的真题到现在2017年的历年真题,很完整,很清晰,每题注有年份和题号
2021-09-23 15:22:19 1.45MB CCF CSP 认证历年真题
1