所有文章

資料科學-用Sikit Learn做資料預測

5042 分鐘閱讀
資料科學python
資料科學-用Sikit Learn做資料預測

前言-會做到什麼功能

  1. 利用鳶尾花資料集,利用花萼與花瓣的長寬來預測這是什麼物種
  1. 利用各種資訊判斷房價

下載資料

鳶尾花是長這樣的

Image

透過kaggle下載鳶尾花資料

python
import kagglehub

# Download latest version
path = kagglehub.dataset_download("uciml/iris")

print("Path to dataset files:", path)

#列出下載了什麼檔案
import os 
os.listdir(path)

透過路徑,看下載的檔案

python
import pandas as pd
df = pd.read_csv(os.path.join(path,'Iris.csv'))
df.head()
Image

可以看看有幾種種類的鳶尾花

python
df['Species'].unique()
Image

資料處理

品種以數字來呈現會更好在後續做處理,於是先來做個轉換

python
df['Species'].map({'Iris-setosa':0,'Iris-versicolor':1,'Iris-virginica':2})
Image

探索式分析

先用視覺化圖表感覺之間的關係,以plotly來繪圖

版權聲明

文章標題:資料科學-用Sikit Learn做資料預測

文章作者:阿盧老師

文章連結:https://codinglu.tw/blog/streamlit-database-gpt-chatbot

授權條款:本文採用 CC BY-NC 4.0 授權。轉載請標明出處。