由于XGboost的R包并没有对GPU的支持,而我又一定要用R语言,刚好官网上提供了自己编译能让R包支持CUDA。自己在学习实践XGboost时,想用他和随机森林的方法进行比较,需要构建大量的树,用上GPU希望能加快训练速度。但是编译的过程十分的痛苦,记录一下也许可以对别人有所帮助。

阅读全文 »

决策树最早是由Brieman等人一起提出的,“学名”可以被叫做连续递归切分的分类和回归树。顾名思义,就是用一种衡量标准去衡量每个变量在当前的数据集上的表现,并以此找到最佳表现的变量最为切分点,生成子树,并连续递归的切分下去,应用在分类或是回归问题当中,到后来还衍生出了随机深林,提升树,还有国人发现的XGBoost方法。

阅读全文 »

很多朋友包括我,一提起 git 首先想到的是 GitHub,以及 GitHub 后面所代表的丰富的社区和代码分享。但是我今天想说的是,即使你的代码甚至是文件不是准备用来分享的,也推荐使用 git。

阅读全文 »