@好东西传送门 出品, 过刊见 http://ml.memect.com
订阅:给 [email protected] 发封空信, 标题: 订阅机器学习日报
可点击加长版47条 http://memect.co/ml-list-2015-01-25
@爱可可-爱生活
关键词:自然语言处理, Olivier Grisel
[幻灯]《An overview of word embeddings》by Olivier Grisel [1] 云盘: [2]
[1] https://speakerdeck.com/ogrisel/an-overview-of-word-embeddings
[2] http://cloud.letv.com/s/izDINxt0
@bitslife
关键词:经验总结, 深度学习, 算法, 博客, 代码, 数据库
HyperLogLog [1] 计数算法在生物信息学中的应用有:Kmer计数 [2] 和基因组拼装 [3] ,HyperLogLog在Github 上各种实现,C, Javascript, Rust, haskell等,redis、postgresql 等都有hll的实现,推荐下 @敲代码的张洋 的几篇博文 [4]
[1] http://en.wikipedia.org/wiki/HyperLogLog
[2] https://github.com/ged-lab/khmer/pull/257
[3] http://dl.acm.org/citation.cfm?id=2683642
[4] http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-i.html
@网路冷眼
关键词:深度学习, 视觉, 资源, 行业动态, 贾扬清, 课程
[Caffe 深度学习框架上手教程] [1] Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 贾扬清,目前在谷歌工作。本文详细介绍了它的优势、架构,网络定义、各层定义、安装与配置,解读了它实现的图像分类模型AlexNet,并演示了CIFAR-10在caffe上进行训练与学习
[1] http://www.csdn.net/article/2015-01-22/2823663
@西瓜大丸子汤
关键词:自然语言处理, 主题模型
topic modeling里topic的数量,大家一般都是怎么选的呢?
好东西传送门 原微博 转发于2015-01-25 06:51
总结大家的答案。@子元是个变态 @南山盖盖 推荐用HDP(dirichlet precess)不用预先确定topic数,gensim有实现 http://t.cn/RZ8SOwJ @eastseek 说看每个主题内部的凝聚力,不建议乱选一个固定数字。@唐杰THU 说Sqrt(#doc)
@bicloud笑西西
关键词:经验总结, 资源, 博客, 视频
100 most popular Machine Learning talks at VideoLectures.Net [1]
[1] http://blog.videolectures.net/100-most-popular-machine-learning-talks-at-videolectures-net/