问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

python数据挖掘常用工具有哪几种?

发布网友 发布时间:2022-04-23 15:44

我来回答

3个回答

懂视网 时间:2022-04-06 07:00

相关学习推荐:python教程

先来给大家介绍一下另外一个很有用的数据分析库——matplotlib。



matplotlib简介

如果你在大学里参加过数学建模竞赛或者是用过MATLAB的话,相比会对这一款软件中的画图功能印象深刻。MATLAB可以做出各种函数以及数值分布图像非常的好用和方便。如果你没用过呢也没关系,知道这么回事就好了。MATLAB虽然好用,但毕竟是收费软件,而且相比于MATLAB,很多人更喜欢Python的语法。

所以呢MATLAB就被惦记上了,后来有大神仿照MATLAB当中的画图工具,也在Python当中开发了一个类似的作图工具。这也就是我们今天这篇文章要讲的matplotlib,也是Python、数据分析以及机器学习领域当中使用最广泛的作图工具包,几乎没有之一。前段时间不是美国政府搞事情,导致MATLAB公司宣布对中国的几所高校禁止使用MATLAB嘛,有一些人就提出来说我们可以使用Python当中的一些开源工具代替,当然MATLAB当中还有很多其他厉害的功能,Python可能不一定能代替,但至少在作图这个领域是没问题的。

matplotlib 基本用法

matplotlib广泛流行的一个非常主要的原因就是它方便、好用,我们来看几个经典的例子就知道了,短短几行代码就可以作出质量非常高的图。

我们使用的是matplotlib这个包下的pyplot这个库,从名字上我们也看得出来它是Python库。如果你安装了Anaconda这样完整的Python包管理工具的话,那么这个包默认应该已经装好了。如果没有,可以使用pip安装一下,命令也非常简单。

pip install matplotlib复制代码

装好了包之后,我们通常的使用惯例是将它重命名成plt,所以如果你阅读一些源码以及其他大神的代码,作图的时候经常会出现plt.xxx,就是这么来的。

import matplotlib.pyplot as plt复制代码

plot当中有几种常用的作图工具,第一种是作折线图或者是曲线图的,叫做plot。第二种是作柱状图的叫做hist,第三种是作散点图的,叫做scatter,第四种是作饼状图的。除此之外还可以作一些三维的图像,但是一般日常当中使用得比较少,大部分是用来炫技的。

曲线图

plot其实是用来作曲线图的,采用的方法是描点呈现,它会将我们的数据点串联起来,成为一条光滑的曲线。当然,作折线、直线也都是可以的,最后成图的效果完全是由我们的数据决定的。

它的使用方法很简单,在最基本的用法当中,我们只需要传入两个list,分别代表x轴和y轴的值即可。比如我们要作出一个logistic的函数图像。我们可以这样:

x = np.linspace(-10, 10, 100)y = 1 / (1 + np.exp(-x))plt.plot(x, y)plt.show()复制代码

在上面的代码当中我们首先使用numpy当中的linspace函数生成了一个-10到10之间的numpy数组。这个数组当中有100个点,在-10到10之间均匀分布。我们对它计算对应的logistic函数的值,也就是。这个函数我想大家都应该很熟悉了,x是一个一百个点的list,对应的y也是一个一百个点的list。也就是说一个x对应一个y构成了一个点对,代表图中的一个坐标。

我们不需要做任何转化,只需要把这两个数组传入plt当中,它会自动替我们完成坐标的映射。最后呈现的效果如下。

我们可以看到作图的效果还是不错的,除了把图像完成的绘制出来之外,还替我们在坐标轴上画上了点位,方便我们查看数据。

直方图

hist可以用来绘制直方图,这也是我们非常常见的图像。在财经领域我们经常用直方图反应一个数据的走势,在数据分析和机器学习当中我们也经常用直方图来反应某一个特征或者是值的分布。

在直方图当中我们只需要传入一个数组,就是我们要求分布的数组,另外我们需要再输入一个参数bins,表示我们希望将数据分桶的数量。然后它会绘制出每个桶中数据数量的直方图,这样我们就可以很直观地看出分布来了。

x = np.random.normal(size=200)plt.hist(x,bins=30)plt.show()复制代码

这里我们调用numpy当中以正态分布概率随机的函数,得到的结果应该是正态分布的。

我们查看图像,这个结果和我们的预期基本吻合。

点状图

第三种图像叫做散点图,它反应的是每个点的分布情况。比如我们之前在介绍KNN和Kmeans模型的时候曾经都作过散点图,一个点代表一个样本,通过散点图我们观察的也是样本和数据分布的情况。但是和直方图相比它更加得直观,我们能直接看到分布,而不是一个分布的统计结果。

但是它也有缺点,缺点就是我们只能观察二维平面当中的点的分布,毕竟超过3维的维度就没办法绘制了。而且3维的数据分布也不是很好观察。

同样散点图的绘制也很简单,我们只需要调用scatter函数传入x和y的数组即可。

x = np.random.rand(100)y = np.random.rand(100)plt.scatter(x, y)复制代码

这里我们的x和y都是随机分布,所以得到的结果是散乱没有规律的点。

饼状图

最后我们来看下饼状图,饼状图也很常用,虽然也是反映的数据分布,但是它更多是体现某一个值占的比例。通过饼状图,我们可以很直观地了解到这点。

我们可以传入一个list进入pie函数,plot会根据list当中值在总体的占比绘制饼状图。我们来看个很简单的例子:

a = np.array([0.5, 0.3, 0.2, 0.1, 0.8])plt.pie(a)复制代码

得到的结果如下:

和之前的结果相比饼状图稍稍不清晰一些,因为它虽然用不同颜色区分了不同的区域的,但是我们很难直观地看出来每一个区域分别代表什么。这个问题是可以解决的,我们可以通过传入一些参数和设定来让它展示更多的信息,让数据变得更加生动以及清晰。

想了解更多编程学习,敬请关注php培训栏目!

热心网友 时间:2022-04-06 04:08

python有强大的第三方库,广泛用于数据分析,数据挖掘、机器学习等领域,下面小编整理了python数据挖掘的一些常用库,希望对各位小伙伴学习python数据挖掘有所帮助。

1. Numpy
能够提供数组支持,进行矢量运算,并且高效地处理函数,线性代数处理等。提供真正的数组,比起python内置列表来说, Numpy速度更快。同时,Scipy、Matplotlib、Pandas等库都是源于 Numpy。因为 Numpy内置函数处理数据速度与C语言同一级别,建议使用时尽量用内置函数。
2.Scipy
基于Numpy,能够提供了真正的矩阵支持,以及大量基于矩阵的数值计算模块,包括:插值运算,线性代数、图像信号,快速傅里叶变换、优化处理、常微分方程求解等。
3. Pandas
源于NumPy,提供强大的数据读写功能,支持类似SQL的增删改查,数据处理函数非常丰富,并且支持时间序列分析功能,灵活地对数据进行分析与探索,是python数据挖掘,必不可少的工具。
Pandas基本数据结构是Series和DataFrame。Series是序列,类似一维数组,DataFrame相当于一张二维表格,类似二维数组,DataFrame的每一列都是一个Series。
4.Matplotlib
数据可视化最常用,也是醉好用的工具之一,python中著名的绘图库,主要用于2维作图,只需简单几行代码可以生成各式的图表,例如直方图,条形图,散点图等,也可以进行简单的3维绘图。
4.Scikit-Learn
Scikit-Learn源于NumPy、Scipy和Matplotlib,是一 款功能强大的机器学习python库,能够提供完整的学习工具箱(数据处理,回归,分类,聚类,预测,模型分析等),使用起来简单。不足是没有提供神经网络,以及深度学习等模型。
5.Keras
基于Theano的一款深度学习python库,不仅能够用来搭建普通神经网络,还能建各种深度学习模型,例如:自编码器、循环神经网络、递归神经网络、卷积神经网络等,重要的是,运行速度几块,对搭建各种神经网络模型的步骤进行简化,能够允许普通用户,轻松地搭建几百个输入节点的深层神经网络,定制程度也非常高。
6.Genism
Genism主要用来处理语言方面的任务,如文本相似度计算、LDA、Word2Vec等。
7.TensorFlow
google开源的数值计算框架,采用数据流图的方式,可灵活搭建深度学习模型。

热心网友 时间:2022-04-06 05:26

1、 Numpy:提供数组支持,进行矢量运算,高效地处理函数,线性代数处理等,提供真正的数组,比如说Python内置列表来说, Numpy速度更快, Numpy内置函数处理数据速度与C语言同一级别,使用的时候尽可能使用内置函数。
2、Scipy:可以提供真正的矩阵支持,以及大量基于矩阵的数值计算模块,包含:插值运算、线性代数、图像信号、优化处理、常微分方程求解等。
3、Pandas:提供强大的数据读写功能,支持类似SQL的增删改查,数据处理函数非常丰富,支持时间序列分析功能,灵活地对数据进行分析与探索,是Python数据挖掘不可缺少的工具。
4、Matplotlib:数据可视化最常用,也是最好用的工具之一,Python中著名的绘图库,主要用于2维作图,简单的几行代码就可以生成各式图表,比如说直方图,条形图,散点图等。
5、Keras:一款深度学习Python的库,不仅能够用来搭建普通神经网络,还能建各种深度学习模型,比如说自编码器、循环神经网络、递归神经网络、卷积神经网络等。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
如何评价动画女恶魔人 如何评价动画女恶魔人? 途观胎压监测在哪? 勤劳一生什么生肖 一生劳碌一生享最准的生肖 勤劳一生是什么生肖 勤劳一生,终会得奖,天道酬勤作栋梁指是什么生肖,词典梳理落实 温州有哪些性价比高的面馆推荐? 护士执业资格证的照片怎么审核成功 二33乐园怎么下载? 《Python数据分析与数据化运营》epub下载在线阅读全文,求百度网盘云... 学习Python爬虫后想学数据挖掘和数据分析。请问有哪些Python数据挖掘和数据分析的书籍 Python3数据分析与挖掘建模实战 荐书:Python数据分析与挖掘实战? python数据挖掘难不难? 《Python数据分析与挖掘实战》怎么样 《从零开始学Python数据分析与挖掘第二版》pdf下载在线阅读全文,求百 ... Python和数据挖掘有什么关系 《Python数据挖掘入门与实践》pdf下载在线阅读,求百度网盘云资源_百 ... 梦见自己和以前同学在一个新班级还有一大堆不认识的同学在一起上课,怎么回事? 梦见自己上学被全班同学讨厌 梦见和不熟的男同学闯进陌生的教室 梦见跟人打架(讨厌的同性同学),是什么征兆? 开通龙支付的手机号注销了怎么办 梦到老师同学,高手帮忙解解 微信页面会有左下角是登录右下角是注册怎么打不开? 我的朋友办了一张建设银行卡,在里边下载了一个龙支付,在抢优惠券的时候不显示优惠券,这是什么情况?_百度问一问 经常梦见学校和教室,不知何解? 龙支付 多个手机号 怎么看不到微信注册页面? 数据挖掘方向,Python中还需要学习哪些内容 python数据挖掘与分析需要哪些数学知识 微信网名女生简单气质是什么? 女人成熟气质的微信名 思科认证,华为认证,四级网络管理员考试各有什么不同 华为服务器有没有is09001认证,iso14001认证,gjb9001认证,cmmi 4级证书,商用密码产 国家计算机等级考试四级网络工程师有什么用?和华为认证的有什么区别? 为什么我的电脑无线网络受限啊,哪里出问题了 美味的鲜蘑肉片怎么炒? 鲜蘑炒肉片怎么做? 蘑菇炒肉丝怎么做 蘑菇炒肉的做法是什么? 蘑菇炒肉需要炒多长时间 蘑菇炒肉怎么炒 牛排配菜有哪些 鲜蘑炒肉片的做法,鲜蘑炒肉片怎么做好吃,鲜蘑 瘦肉蘑菇怎么炒才好吃 自己煎牛排,配什么蔬菜 鲜蘑炒肉多少钱一盘? 自己做牛排的配菜怎么做?(番茄)
  • 焦点

最新推荐

猜你喜欢

热门推荐