调包侠神器2.0公布,Python机械学习模子搭建只需要几行代码

2020-08-02 网络
浏览
[科技新闻]调包侠神器2.0公布,Python机械学习模子搭建只需要几行代码

原标题:调包侠神器2.0宣布,Python机械进修模子搭建只须要几行代码

萧箫 发自 凹非寺

量子位 报导 | 民众号 QbitAI

Python开源机械进修建模库 PyCaret,方才宣布了2.0版本。

这款可谓「调包侠神器」的模子练习东西包, 几行代码就能够搞定模子编写、革新和微调。

从数据预处置惩罚到模子效果对照,PyCaret都能 自动完成

所以,PyCaret长啥样,2.0的版本又做了什么革新?

一起来看看。

机械进修库的「炼丹炉」

PyCaret说白了,有点像一个机械进修库的 炼丹炉

以下是它「熔」进来的部份库:

数据处置惩罚:pandas、numpy…

数据可视化:matplotlib、seaborn…

种种模子:sklearn、xgboost、catboost、lightgbm…

嗯…sklearn直接就给封装进去了,挪用很轻易。

然后,PyCaret这个炼丹炉,自带功用“按键” (定义了一些函数),包括数据预处置惩罚、模子练习、模子集成、模子剖析、模子测试等。

只须要写上几行Python代码,这些功用“按键”就会被按下,PyCaret自动帮你完成。

至于完成过程当中须要挪用什么基础库,那些 能够摒弃思索不须要斟酌。

从下图来看,仅仅是 预处置惩罚阶段,就包括样本分别、数据预处置惩罚、缺失值处置惩罚、归一化、独热编码等功用。

假如要完成必须的预处置惩罚功用,须要若干行代码来挪用?

答案是 0行

由于,当运用setup举行初始化时,PyCaret将 自动实行机械进修必须的数据预处置惩罚步骤,包括缺失值插进去、分类变量编码、标签编码、数据集拆分等。

比方,在数据处置惩罚前,你发明数据集有空白的处所 (下图中NaN部份)

别怕,PyCaret会自动剖析数据,举行缺失值插进去。

预处置惩罚后,PyCaret还贴心肠帮你预备了种种模子。

从模子练习、选用到测试,只要你想不到的,没有它做不了的。

假如已将数据处置惩罚好,并交给PyCaret,一个 compare_models函数就能够 练习库中的一切模子,举行效果比较后,标出最好模子。

如下图,种种模子目标的最优值会被一键标黄,就看你如何挑选了。

,科技日报,

选好后,想对模子举行一点优化?一个 tune_model函数就能够帮你搞定。

或许,不想仅仅选用一个模子?

PyCaret也预备了 模子集成的函数,blend和stack任你选。

除此之外,模子参数的剖析 (包括可视化)也只须要几行代码就能够完成,功用异常壮大。

末了,PyCaret还能为新数据供应迭代 展望效果,下面的效果,一样只须要几行代码就能够完成。

那末,此次PyCaret加强,举行了什么革新呢? (项目见传送门)

PyCaret 2.0加强版

这是PyCaret 2.0的6大特征,有些在1.0就有了,有些功用如 试验日记,看起来是更新后新到场的功用。

试验日记,关于模子的调解不可或缺。

比方,想要将练习过程当中模子的精度变化 可视化,一般我们会在模子中到场生成日记文件的函数,生成一个更直观的时候-精度变化图。

PyCaret 2.0到场了试验日记的功用,自动帮你跟踪模子试验过程当中的各项目标,以及生成视觉效果等。

不仅如此,在2.0中,模子生成到展望的一切事情流程,如今能够被设想了。

也就是说,你能够设置一条自定义「流水线」,在这个过程当中,从练习到测试,一切模块的功用都会被自动化完成。

以至,PyCaret 2.0还供应了机械进修模子前端软件的搭建东西。

以及,PyCaret 2.0如今险些支撑一切算法的并行处置惩罚,xgboost和catboost模子也支撑GPU练习。

除此之外,另有一些新的程序功用,守候你去发明。

传送门

项目地点:

https://github.com/pycaret/pycaret/releases/tag/2.0

本文系网易消息•网易号特征内容鼓励设计签约账号【量子位】原创内容,未经账号受权,制止随便转载。

报名 |「隐私盘算 AI」手艺直播

不相识任何隐私AI手艺的情况下,开发者如何做到只修改两三行代码,就将现有AI代码转换为具有数据隐私庇护功用的程序?

8月6号, 中科院软件研究所博士、矩阵元算法科学家--谢翔将直播剖析,加小助手“qbitbot9”或许直接扫码,即可进入直播交换群:

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI手艺和产物新动态

完整的精益生产系统若何驱动企业取得全球乐成?

在以下这篇为2007年修订版做准备的文章中,JimWomack(詹姆斯·沃麦克)正确地预测了丰田的崛起,并指出了完整精益生产系统的关键要素。 在我和Dan Jones(丹尼尔·琼斯)最近出版的《Le…