第17章 Python Spark MLlib 決策樹多元分類


17.2 UCI Covertype資料集介紹
Step2. UCI Covertype 資料集
下載網址
https://archive.ics.uci.edu/ml/datasets/Covertype
17.3 下載與查看資料
Step1. 下載/ 解壓縮檔案
如果您尚未建立工作目錄,請先建立工作目錄
mkdir -p ~/workspace/Classification/data
cd ~/workspace/Classification/data
wget https://archive.ics.uci.edu/ml/machine-learning-databases/covtype/covtype.data.gz

gzip -d covtype.data.gz

Step3. 查看covtype.data 資料

cat covtype.data|more
 RunDecisionTreeMulti.py程式
請參考本書附錄APPENDIX A 本書範例程式下載與安裝說明 ,A.3 開啟eclipse PythonProject範例程式: RunDecisionTreeMulti.py
此圖出自Spark官網 https://spark.apache.org/


以上內容節錄自這本書,很適合Python程式設計師學習Spark機器學習與大數據架構,點選下列連結查看本書詳細介紹:
  Python+Spark 2.0+Hadoop機器學習與大數據分析實戰
  http://pythonsparkhadoop.blogspot.tw/2016/10/pythonspark-20hadoop.html

《購買本書 限時特價專區》
博客來網路書店: http://www.books.com.tw/products/0010730134?loc=P_007_090

天瓏網路書店: https://www.tenlong.com.tw/items/9864341537?item_id=1023658
  

露天拍賣:http://goods.ruten.com.tw/item/show?21640846068139
蝦皮拍賣:https://goo.gl/IEx13P 



Share on Google Plus

About kevin

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

0 意見:

張貼留言