Python 資料分析常用的四個工具包是numpy、scipy、pandas 和matplotlib
- numpy是Python數值計算的基礎工具包,提供科學計算常使用的陣列或矩陣。
- matplotlib 是則幫助我們在python內將資料圖表化。
- scipy是基於numpy的科學計算包,包括統計、線性代數等工具。
- pandas是基於numpy的資料分析工具,能夠快速的處理結構化資料的大量資料結構和函數。
學會Matplotlib可以幫助我們將資料處理後視覺化的表現出來,好方便我們瞭解資料的特性 ,
下面示範了3個常用的圖表,Histogram直方圖,x-y關係圖, 以及scatter分散圖
import matplotlib.pyplot as plt Data_exp=[20,30,40,50,60,21,33,22,35,41,42,65,50,21,37,26,15,39,27,42] x = [1,2,3,5,9] # Histogram of Data_exp, 15 bins # x-y chart |
結果如下
|
Scatter Chart範例
import matplotlib.pyplot as plt x_data=[1,20,3,4,5,6,8,7,7808,9,10,12,11,5,8,9,14,11.5,12,4] 'yellow','white','blue','green','red','yellow','white','blue','green' # Previous customizations #additonal text # Add grid() call # Show the plot |
結果如下
alpha=1 alpha=0.1 加入格線與註解在圖表上 |
Reference