附錄 A 本書範例程式下載與 安裝說明

A.1 下載範例程式 cd ~/ wget http://www.drmaster.com.tw/download/example/MP21622_example.zip unzip MP21622_example.zip A.2 開啟本書iPython No...
Read More

第18章 Python Spark MLlib 決策樹迴歸分析

18.2 Bike Sharing資料集 網址 http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset 18.3 下載與查看資料 Step1. 下載/ 解壓縮檔案 如果您尚未建立工作目錄,請先建立工作...
Read More

第17章 Python Spark MLlib 決策樹多元分類

17.2 UCI Covertype資料集介紹 Step2. UCI Covertype 資料集 下載網址 https://archive.ics.uci.edu/ml/datasets/Covertype 17.3 下載與查看資料 Step1. 下載/ 解壓縮...
Read More

第14~16章 範例程式下載

  請參考本書附錄APPENDIX A 本書範例程式下載與安裝說明 ,A.3 開啟eclipse PythonProject範例程式: 第14章: RunLogisticRegressionWithSGDBinary.py 第15章: RunNaiveBayesBinar...
Read More

第13章 Python Spark MLlib 決策樹二元分類

13.4.2 下載StumbleUpon 資料 進入Kaggle 網站的StumbleUpon 頁面。 https://www.kaggle.com/c/stumbleupon/data 13.4.4 複製到專案目錄 Step1. 複製下載檔案至專案data 子目錄 ...
Read More

第12章 Python Spark 建立推薦 引擎

12.4 如何蒐集資料? 網址進入moivelens 網站: http://grouplens.org/datasets/movielens/ Step1. 下載ml-100k 資料 mkdir -p ~/pythonwork/PythonProject/data cd...
Read More

第11章 Python Spark 整合開發 環境介紹

11.1 下載與安裝eclipse Scala IDE Step1. 瀏覽Scala IDE 網頁 http://scala-ide.org/ 11.2 安裝pyDev Step1. 執行eclipse 程式 輸入工作路徑 /home/hduser/pythonwo...
Read More

第10章 Python Spark RDD 介紹

10.2 開啟IPython Notebook Step1. 在local 模式執行IPython Notebook 使用Spark cd ~/pythonwork/ipynotebook PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DR...
Read More

第9章 在IPython Notebook 執 行Python Spark 程式

9.1 安裝Anaconda Step1. 複製安裝Anaconda 下載網址 連結continuum網址 https://repo.continuum.io/archive/index.html Step2. 下載Anaconda2-2.5.0-Linux-x86_6...
Read More