当先锋百科网

首页 1 2 3 4 5 6 7

先引入matplotlib.pyplot模块

from matplotlib import pylab as plt
import numpy as np

  • 绘制散点图

散点图可以直观醒目地反映数据的分布形态以及变量间的统计关系

函数:plt.scatter(x,y,size='',color='',marker='*',alpha='透明度')

x=np.random.randn(1000)//randn函数返回一个或一组样本,具有标准正态分布
y=np.random.randn(1000)
plt.scatter(x,y,color='g',marker='*',alpha=0.5)
plt.title('Scatter plot 1000 random data from normal distribution')
plt.xlim(-5,5)//调整x的坐标为-5到5
plt.xlim(-5,5)//调整y的坐标为-5到5
plt.show()

  • 绘制箱线图

箱线图可以直观明了地识别数据中的异常值,并且在不受异常值的影响下以一种相对平稳的方式描述数据的分散情况。

# 可以再看一下壁炉数量和房价的关系,发现壁炉越多,房价越高
var = 'Fireplaces'
data = pd.concat([train['SalePrice'], train[var]], axis=1)

f, ax = plt.subplots(figsize=(16, 8))

fig = sns.boxplot(x=var, y="SalePrice", data=data)
fig.axis(ymin=0, ymax=800000)
plt.xticks(rotation=90)