模块:
- interfaces - 核心gensim接口
- utils - 多个工具函数
- matutils - 数学工具
- corpora.bleicorpus - 在Blei的LDA-C格式的语料
- corpora.dictionary - 构建word<->id的映射关系
- corpora.hashdictionary - 构建word<->id的映射关系
- corpora.lowcorpus - 以word list格式存在的语料
- corpora.mmcorpus - 以Matrix Market格式存在的语料
- corpora.svmlightcorpus - 以SVMlight格式存在的语料
- corpora.wikicorpus - dump自Wikipedia的语料
- corpora.textcorpus - 使用字典来构建corpora
- corpora.ucicorpus - uci 词袋模型的corpus
- corpora.indexdcorpus - corpus文档的随机访问
- models.ladmodel - LDA
- models.ldamulticore - 并行LDA
- models.ldamallet - 通过Mallet进行LDA
- models.lsimodel - 潜语义索引
- models.tfidfmodel - TF-IDF模型
- models.rpmodel - Random Projections
- models.hdpmodel - HDP
- models.logentropy_model - LogEntropy模型
- models.lsi_dispatcher - 分布式lsi的dispatcher
- models.lsi_worker - 分布式lsi的worker
- models.lda_dispatcher - 分布式LDA的dispatcher
- models.lda_worker - 分布式LDA的worker
- models.word2vec - word2vec进行深度学习
- models.doc2vec - 使用paragraph2vec进行深度学习
- models.dtmmodel - 动态主题模型(DTM)和dynamic influence model(DIM)
- models.phrases - 短语检测
- similarities.docsim - 文档相似查询
- simserver - 文档相似服务器