1
mko0okmko0 2015-11-24 22:57:33 +08:00
你有 OPENCV 的经验吗?
如果有.我刚刚稍为查了一下"量子疤痕态"的图片.可能适合拐角侦测. 当然直接丢 CUDNN 训练也不是不可能. 没看过目标图片跟非目标图片.无法确定你的需求. 要慢慢谈,FB:https://www.facebook.com/longsing.chen 因为需要看到几张图. |
2
zx120120 2015-11-24 23:36:41 +08:00
不知道你的具体图片什么样子,不太好下判断。
但是既然你们有直觉可以写程序,那应该就是可以的。 这应该是个分类问题。 你要做的就是,准备若干张(几百或者几千) 目标 pattern 的图片,还有若干张 非目标 pattern 图片。 然后训一个 SVM 或者 Logistic Regression 或者其他随便什么分类器就好了。 scikit-learn 当然是可以干这件事的,里面自带了 SVM 和 LR 分类器,非常好用的。 大概的步骤就是, n 张图片读进来,拍扁成一条条的行向量。 然后扔给 classifier 训练出来得到一个 model ,用那个 model 里的 predict 函数就可以了。 但是刚刚回头我看了下我自己 BB 的过程,觉得十分不清晰。 所以强烈建议楼主过一边 Coursera 上的 Machine Learning[https://www.coursera.org/learn/machine-learning/] 差不多看到第三章 Logistic Regression 就应该会有个很清晰的概念了,然后看看文档应该就能用了。 (之后,目测之后还有必要看一下 第八章的 PCA 。) |
3
northisland 2015-11-25 00:03:34 +08:00
I. SIFT 等特征 + BOVW 或者 FISHER VECTOR [ + 稀疏表示 ] = 固定维度的特征向量(一般是几 k 维,图像整体的维数是几 m 维)
II. 特征向量 + 分类器 = 分类结果(一般训练样本的数量和分类模型复杂度要基本相等,也就是说,你有几 k 张图片,想训练几 m 个参数的模型,完全就是开玩乐。所以必须把图片的几 m 维缩小成几 k 维向量) I 用 opencv 或者 VLFeat 做, II 可以用 sklearn 做 然而这个过程是 2012 年前的玩法了~ 现在流行用深度学习 CNN 玩这一套了 睡前一水,这篇讲纹理分类的文章很好 describing textures in the wild |