精准猎取科技资讯,天堂视频在线观看,高效阅读科技新闻_黄色av网站在线免费观看_科技猎

Python優雅地可視化數據

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

Python優雅地可視化數據

作者:冰不語

最近看《機器學習系統設計》…前兩章。學到了一些用Matplotlib進行數據可視化的方法。在這里整理一下。

聲明:由于本文的代碼大部分是參考書中的例子,所以不提供完整代碼,只提供示例片段,也就是只能看出某一部分用法,感興趣的需要在自己的數據上學習測試。

最開始,當然還是要導入我們需要的包:

				# -*- coding=utf-8 -*-
				from matplotlib import pyplot as plt
				from sklearn.datasets import load_iris
				import numpy as np
				import itertools1234512345
			

1. 畫散點圖

畫散點圖用plt.scatter(x,y)。畫連續曲線在下一個例子中可以看到,用到了plt.plot(x,y)。

plt.xticks(loc,label)可以自定義x軸刻度的顯示,第一個參數表示的是第二個參數label顯示的位置loc。

plt.autoscale(tight=True)可以自動調整圖像顯示的最佳化比例 。

				plt.scatter(x,y)
				plt.title("Web traffic")
				plt.xlabel("Time")
				plt.ylabel("Hits/hour")
				plt.xticks([w*7*24 for w in range(10)],['week %i' %w for w in range(10)])
				plt.autoscale(tight=True)
				plt.grid()
				##plt.show()1234567812345678
			

畫出散點圖如下:

Python優雅地可視化數據
2. 多項式擬合并畫出擬合曲線

## 多項式擬合

				fp2 = np.polyfit(x,y,3)
				f2 = np.poly1d(fp2)
				fx = np.linspace(0,x[-1],1000)
				plt.plot(fx,f2(fx),linewidth=4,color='g')
				## f2.order: 函數的階數
				plt.legend(["d=%i" % f2.order],loc="upper right")
				plt.show()123456789123456789
			

效果圖:

Python優雅地可視化數據
3. 畫多個子圖

這里用到的是sklearn的iris_dataset(鳶尾花數據集)。

此數據集包含四列,分別是鳶尾花的四個特征:

sepal length (cm)——花萼長度

sepal width (cm)——花萼寬度

petal length (cm)——花瓣長度

petal width (cm)——花瓣寬度

這里首先對數據進行一定的處理,主要就是對特征名稱進行兩兩排列組合,然后任兩個特征一個一個做x軸另一個做y軸進行畫圖。

				# -*- coding=utf-8 -*-
				from matplotlib import pyplot as plt
				from sklearn.datasets import load_iris
				import numpy as np
				import itertools
				data = load_iris()
				#print(data.data)
				#print(data.feature_names)
				#print(data.target)
				features = data['data']
				feature_names = data['feature_names']
				target = data['target']
				labels = data['target_names'][data['target']]
				print(data.data)
				print(data.feature_names)123456789101112131415161718123456789101112131415161718
			

這里有一個排列組合參考代碼,最后是取出了兩兩組合的情況。

排列組合的結果是feature_names_2包含了排列組合的所有情況,它的每一個元素包含了一個排列組合的所有情況,比如第一個元素包含了所有單個元素排列組合的情況,第二個元素包含了所有的兩兩組合的情況……所以這里取出了第二個元素,也就是所有的兩兩組合的情況

				feature_names_2 = []
				#排列組合
				for i in range(1,len(feature_names)+1):
				iter = itertools.combinations(feature_names,i)
				feature_names_2.append(list(iter))
				print(len(feature_names_2[1]))
				for i in feature_names_2[1]:
				print(i)123456789123456789
			

下面是在for循環里畫多個子圖的方法。對我來說,這里需要學習的有不少。比如

for i,k in enumerate(feature_names_2[1]):這一句老是記不住。

比如從列表中取出某元素所在的索引的方法:index1 = feature_names.index(k[0]),也即index = list.index(element)的形式。

比如for循環中畫子圖的方法:plt.subplot(2,3,1+i)

比如for循環的下面這用法:for t,marker,c in zip(range(3),”>ox”,”rgb”):

				plt.figure(1)
				for i,k in enumerate(feature_names_2[1]):
				index1 = feature_names.index(k[0])
				index2 = feature_names.index(k[1])
				plt.subplot(2,3,1+i)
				for t,marker,c in zip(range(3),">ox","rgb"):
				plt.scatter(features[target==t,index1],features[target==t,index2],marker=marker,c=c)
				plt.xlabel(k[0])
				plt.ylabel(k[1])
				plt.xticks([])
				plt.yticks([])
				plt.autoscale()
				plt.tight_layout()
				plt.show()12345678910111213141234567891011121314
			

這里的可視化效果如下:

Python優雅地可視化數據
4. 畫水平線和垂直線

比如在上面最后一幅圖中,找到了一種方法可以把三種鳶尾花分出來,這是我們需要畫出模型(一條直線)。這個時候怎么畫呢?

下面需要注意的就是plt.vlines(x,y_min,y_max)和plt.hlines(y,x_min,x_max)的用法。

				plt.figure(2)
				for t,marker,c in zip(range(3),">ox","rgb"):
				plt.scatter(features[target==t,3],features[target==t,2],marker=marker,c=c)
				plt.xlabel(feature_names[3])
				plt.ylabel(feature_names[2])
				# plt.xticks([])
				# plt.yticks([])
				plt.autoscale()
				plt.vlines(1.6, 0, 8, colors = "c",linewidth=4,linestyles = "dashed")
				plt.hlines(2.5, 0, 2.5, colors = "y",linewidth=4,linestyles = "dashed")
				plt.show() 12345678910111234567891011
			

此時可視化效果如下:

Python優雅地可視化數據
5. 動態畫圖

plt.ion()打開交互模式。plt.show()不再阻塞程序運行。

注意plt.axis()的用法。

				plt.axis([0, 100, 0, 1])
				plt.ion()
				for i in range(100):
				y = np.random.random()
				plt.autoscale()
				plt.scatter(i, y)
				plt.pause(0.01)1234567812345678
			

可視化效果:

Python優雅地可視化數據

End.

轉載請注明來自36大數據(36dsj.com): 36大數據 ? Python優雅地可視化數據

本文被轉載1次

首發媒體 36大數據 | 轉發媒體

隨意打賞

python 數據挖掘python 數據分析python 可視化大數據可視化工具數據可視化軟件數據可視化分析地圖數據可視化數據可視化案例數據可視化工具大數據可視化
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 长江船运_国内海运_内贸船运_大件海运|运输_船舶运输价格_钢材船运_内河运输_风电甲板船_游艇运输_航运货代电话_上海交航船运 | 北京公寓出租网-北京酒店式公寓出租平台 | 不锈钢钢格栅板_热浸锌钢格板_镀锌钢格栅板_钢格栅盖板-格美瑞 | 西安中国国际旅行社(西安国旅) | 脱硝喷枪-氨水喷枪-尿素喷枪-河北思凯淋环保科技有限公司 | 热回收盐水机组-反应釜冷水机组-高低温冷水机组-北京蓝海神骏科技有限公司 | 苏州柯瑞德货架-仓库自动化改造解决方案 | RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 大流量卧式砂磨机_强力分散机_双行星双动力混合机_同心双轴搅拌机-莱州市龙跃化工机械有限公司 | HDPE储罐_厂家-山东九州阿丽贝防腐设备 | 旋振筛_不锈钢旋振筛_气旋筛_旋振筛厂家—新乡市大汉振动机械有限公司 | 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | 瓶盖扭矩仪(扭力值检测)-百科 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 气胀轴|气涨轴|安全夹头|安全卡盘|伺服纠偏系统厂家-天机传动 | 智慧农业|农业物联网|现代农业物联网-托普云农物联网官方网站 | 耙式干燥机_真空耙式干燥机厂家-无锡鹏茂化工装备有限公司 | 工业风机_环保空调_冷风机_工厂车间厂房通风降温设备旺成服务平台 | 臭氧灭菌箱-油桶加热箱-原料桶加热融化烘箱-南京腾阳干燥设备厂 臭氧发生器_臭氧消毒机 - 【同林品牌 实力厂家】 | 电梯乘运质量测试仪_电梯安全评估测试仪-武汉懿之刻 | 打孔器,打孔钳厂家【温州新星德牌五金工具】| 塑胶跑道_学校塑胶跑道_塑胶球场_运动场材料厂家_中国塑胶跑道十大生产厂家_混合型塑胶跑道_透气型塑胶跑道-广东绿晨体育设施有限公司 | 长沙印刷厂-包装印刷-画册印刷厂家-湖南省日大彩色印务有限公司 青州搬家公司电话_青州搬家公司哪家好「鸿喜」青州搬家 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 全自动过滤器_反冲洗过滤器_自清洗过滤器_量子除垢环_量子环除垢_量子除垢 - 安士睿(北京)过滤设备有限公司 | 热缩管切管机-超声波切带机-织带切带机-无纺布切布机-深圳市宸兴业科技有限公司 | 天津中都白癜风医院_天津白癜风医院_天津治疗白癜风 | 示波器高压差分探头-国产电流探头厂家-南京桑润斯电子科技有限公司 | 苏州防水公司_厂房屋面外墙防水_地下室卫生间防水堵漏-苏州伊诺尔防水工程有限公司 | 布袋式除尘器|木工除尘器|螺旋输送机|斗式提升机|刮板输送机|除尘器配件-泊头市德佳环保设备 | 硬质合金模具_硬质合金非标定制_硬面加工「生产厂家」-西迪技术股份有限公司 | 发电机价格|发电机组价格|柴油发电机价格|柴油发电机组价格网 | 全国国际学校排名_国际学校招生入学及学费-学校大全网 | 谷歌关键词优化-外贸网站优化-Google SEO小语种推广-思亿欧外贸快车 | 空压机网_《压缩机》杂志 | 充气膜专家-气膜馆-PTFE膜结构-ETFE膜结构-商业街膜结构-奥克金鼎 | TYPE-C厂家|TYPE-C接口|TYPE-C防水母座|TYPE-C贴片-深圳步步精 | 电伴热系统施工_仪表电伴热保温箱厂家_沃安电伴热管缆工业技术(济南)有限公司 | 变频器维修公司_plc维修_伺服驱动器维修_工控机维修 - 夫唯科技 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 玻璃钢型材_拉挤模具_玻璃钢拉挤设备——滑县康百思 | 贴片电容-贴片电阻-二三极管-国巨|三星|风华贴片电容代理商-深圳伟哲电子 |