1
casparchen 2014-03-19 21:16:10 +08:00
我觉得还是综合几种建模方式的结果比较靠谱。比如
建模1:针对每个品牌,该品牌的不同用户点击/收藏/购买肯定是有规律的 建模2:针对每个用户,该用户对品牌的购买情况是有规律的。 比如以上两种建模方式,1的效果我猜是大于2的,因此可以取{建模1结果:建模2结果}={2:1} |
2
webjin 2014-03-19 21:55:36 +08:00
http://gtms02.alicdn.com/tps/i2/T11omZFu0XXXaTF0MH-435-146.png 知道这是什么编辑器吗?那中间的->线是什么弄出来的
|
5
ljcarsenal 2014-03-19 22:14:33 +08:00
@webjin notepad++吧
|
6
vbs 2014-03-19 22:31:12 +08:00
这比赛挺好的,可惜只许在校生参加
|
7
sobigfish 2014-03-19 22:42:56 +08:00
只有报名了才下载的到数据么?
|
8
ericls 2014-03-19 22:47:17 +08:00
数学建模上吧
|
10
yangff 2014-03-20 00:17:33 +08:00
看起来像马尔科夫链……假如上个月对品牌A做了操作B导致下个月对品牌C操作D的概率啥的。。
|
12
66beta 2014-03-20 10:33:05 +08:00
|
15
ericls 2014-03-20 20:52:33 +08:00 via Android
这就是一个不折不扣的数学建模题啊
|
16
armysheng 2014-03-20 22:36:40 +08:00
@buptlee 直接将收藏和购物车作为用户购买行为的依据却是最好么?
如果用前三个月做测试,后1个月做校验,按照你说的直接选有收藏和购物车我算的结果是 predict num is 2858 hit num is 185 total brand is 18537 precision is 0.0647305808258 call rate is 0.00998003992016 F1 is 0.0172937602244 F1才1.7%啊? |
18
armysheng 2014-03-21 15:02:32 +08:00
@buptlee 额,上面说的好像搞错了。上午改了一下,但是如果纯按是否有收藏和购物车来判的话,F1貌似还是不高啊
predict num is 491 hit num is 2 total brand is 1377 precision is 0.0040733197556 call rate is 0.00145243282498 F1 is 0.00214132762313 判断条件的代码是这样的: if int(op3[2])|int(op3[3]) |int(op2[2])|int(op2[3])|int(op1[2])|int(op1[3]): predict_temp.write(uid +"," + bid + "\n") |
20
lj 2014-03-22 13:06:39 +08:00
@armysheng 官方论坛里还是蛮多人在讨论的,看了一圈清晰了很多。P.S. 我也觉得2、3效果有限而且毕竟数据量太小,0和1的correlation比2、3的大多了。
|
21
heliumhgy 2014-03-24 09:52:18 +08:00 via Android
协同过滤算法
|
22
heliumhgy 2014-03-24 10:02:11 +08:00 via Android
据说效果不好
|