最近遇到了一篇论文,在我完成之前就解决了我的研究问题。分享一下,因为这真是*不可思议*。 简而言之:显然你只需训练50K个参数,就能通过训练1500个参数获得良好的性能。 非常酷。最终,这将改变一切。