论文传送: https://arxiv.org/html/2404.19756v1 代码仓库传送:
有没有人小试下效果?结合垂直领域,感觉可以水好多论文!
1
SiWXie 200 天前 via iPhone
火的原因:可以把之前的架构重新用 KAN 做一遍
核心:激活函数用 B 样条曲线代替,激活函数可训练 缺点:引入了 B 样条曲线和网格概念,很容易过拟合,网格调小了又和普通 MLP 没区别了 |
2
SiWXie 200 天前 via iPhone
激活函数可训练是一个切入点,这个 B 样条吧,感觉还是不太合适,是其亮点,也是其缺陷。
可以用其他的代替(干脆用一个神经网络?),这样做感觉又和 MLP 没有区别 反正就是水论文呗 |