最后更新:2020-07-06 10:51:12 手机定位技术交流文章
来自奥菲寺的肖骁量子比特报告|公开号码量子比特
你在朋友圈里见过这样一则小广告吗:

“你必须安静地学习Python,并给每个人一个惊喜。ゥ
现在,GitHub上的一个博客告诉你:不要学,只要用sweetviz。
这是一个基于Python的数据分析软件。只要掌握三个函数,一行Python代码就可以实现数据集的可视化、分析和比较。
让我们以泰坦尼克号数据集为例,输入一行代码:

一个清晰的1080p网络界面出现在我们面前。

不仅根据不同的列(如性别和年龄)对数据进行垂直分析,而且在每一列下对模式、最大值和最小值进行水平比较。
所有输入值和文本信息将被自动检测,数据将被分析、可视化和比较。最后,将为您总结数据。
在这样的数据分析下,结果一目了然。

△显示钛数据集的一些功能细节
这种效果是基于三个主要功能实现的。
三种功能的使用
分析()数据分析

在数据分析功能中,需要设置四个参数,源、目标特征、特征cfg和成对分析。
来源:熊猫中的数据框架数据结构或数据框架中的某个字符串被用作分析对象。
Target_feat:需要标记为目标对象的字符串。
Feat_cfg:需要跳过或强制特定数据类型的特性。
成对分析:相关性和其他类型的数据关联可能需要很长时间。如果超过某个阈值,有必要将该参数设置为开或关,以判断是否有必要分析数据相关性。

△数据相关性分析效果可能需要一些时间
比较()比较两个数据集

如果要比较和分析两个数据集,请使用此比较函数。
在本例中,my_dataframe和test_df是两个数据集,分别称为训练数据和测试数据。
除了这个插入的数据集,其余参数与分析中的参数一致。
数据集列的Compare_intra()比较

如果要分析数据集中某列的参数,应该使用此函数。
例如,如果您需要在“性别”下比较“男性”和“女性”,您可以使用此功能。
在理解了这些函数的变量之后,Python数据分析可以用一行代码来实现。
使用指南
Sweetviz支持Python 3.6+和Pandas0.25.3+。配置环境后,使用通用pip下载安装包:

然而,有一个条件需要注意:sweetviz需要使用基本的“os”模块。因此,如果你正在使用一个类似谷歌可乐的定制环境,你可能无法使用sweetviz,开发者正在探索解决方案。
下载后,用import快速导入sweetviz,你就可以开始使用了~

Sweetviz使用的原理是用一行代码生成一个数据报告对象(其中my_DataFrame是熊猫中的数据框架,一种表格数据结构):

这里,分析函数可以被比较或比较内部函数代替。根据您需要的数据报告类型,上面已经给出了使用方法。
最后,使用显示按钮输出。(结果将显示为SWEETVIZ _ REPORT.html页面)

在这个过程中,实际上只需要编写第二行生成的目标代码,这可以说是一个真正的单行代码生成的数据分析。
显示界面也非常简单。只要鼠标停留在感兴趣的列上,数据分析的图表和报告就会自动显示在右侧。

感兴趣的朋友们,点击下面的门户并使用它~
门户:
https://github.com/fbdesignpro/sweetviz
-完毕-
量子比特签了合同。
请密切关注我们,首先了解最新的技术发展。
本文由 在线网速测试 整理编辑,转载请注明出处。