Liz's Blog

Posts match “ Python ” tag:

Python學習筆記#2:NumPy篇

| Comments

如果像我使用Mac和zsh,可能會在終端機執行jupyter notebook失敗,這可能會是$PATH沒設定到。可以試試看在~/.zshrc檔案中加入export PATH=”$HOME/anaconda3/bin:$PATH”,再重啟終端機即可。

Python學習筆記#9:Plotly (choropleth)地圖資料視覺化篇

| Comments

這幾年國外新聞將地圖資料結合視覺化資訊做得越來越好,看新聞常有真的很會的感覺。這篇choropleth延續之前學到的plotly,有比較多要注意的參數,但基本概念就是go.Figure(data+layout),再用iplot畫出來,多練習幾次就會上手。如果有美國各州統計數據,跑這個圖真的很適合講很多資訊。

Python學習筆記#13:機器學習之邏輯迴歸實作篇

| Comments

邏輯迴歸被視為一種Classification(分類)的方法,處理像是貸款預設(借還是不借)、疾病診斷等問題。當事件發生只有發生與不發生的可能,使用線性迴歸,就顯得不合時宜,反而應該把這條線轉為邏輯迴歸曲線(S函數)來處理。做法是,事件只有0或1,在0.5設一條中心線,低於這條線視為不發生(0),高於這條線,視為發生(1),建立完模型後,放進測試組資料來看模型表現,再用confusion matrix來評估分類的好壞。

Python學習筆記#17:機器學習之K Means Clustering實作篇

| Comments

K Means Clustering是非監督式學習的一種,依照群聚資料的相似度來分類。非監督式學習的特點在於不需預測結果,重點在於找出特定模式。在K Means Clustering演算法中,我們會先定義總共有幾個分群。演算法會隨機分佈任一觀察值到群組內,找到每個群組的centroid,演算法會重複上面這兩個過程,直到組內差異達到最小。組內差異是計算資料點和各自群組中心的距離總和。K值代表共多少分群,真實的資料常常會很難選擇最好的K值,可以選擇elbow method,也就是測試一連串的K值後,再來選擇最好的值。