DDPM扩散模型的数学推导

因为《数字媒体导论》课程要做文献汇报,同组同学选择了和扩散模型相关的论文,而我又没接触过扩散模型,正好学习并整理一下DDPM模型的推导过程。

deep-learning

记一次pytorch Dataset性能优化

最近跑模型的时候发现GPU利用率奇低,基本维持在百分之十几左右,还会间歇性掉到0,导致训练60K个iteration就需要接近3天的时间,而官方论文的训练总数是整整600K iteration,这就意味着如果我要跑一次全量训练起码要30天,这肯定是无法接受的,因此需要定位问题再进行性能优化。

deep-learning

使用词向量和余弦相似度进行文本查重

Word2vec是一种用于自然语言处理的算法,它可以将文本中的单词表示为高维向量,这些向量可以被用来计算单词之间的相似度。而余弦相似度是一种用于计算向量之间相似度的度量方法,本文使用word2vec和余弦相似度结合的方法来进行文本的查重。

deep-learning

LSTM笔记

LSTM计算公式

deep-learning