附錄 A 本書範例程式下載與 安裝說明 kevin 晚上10:44 4 Comments Edit A.1 下載範例程式 cd ~/ wget http://www.drmaster.com.tw/download/example/MP21622_example.zip unzip MP21622_example.zip A.2 開啟本書iPython No... Read More
第18章 Python Spark MLlib 決策樹迴歸分析 kevin 晚上10:17 Add Comment Edit 18.2 Bike Sharing資料集 網址 http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset 18.3 下載與查看資料 Step1. 下載/ 解壓縮檔案 如果您尚未建立工作目錄,請先建立工作... Read More
第17章 Python Spark MLlib 決策樹多元分類 kevin 晚上10:01 1 Comment Edit 17.2 UCI Covertype資料集介紹 Step2. UCI Covertype 資料集 下載網址 https://archive.ics.uci.edu/ml/datasets/Covertype 17.3 下載與查看資料 Step1. 下載/ 解壓縮... Read More
第14~16章 範例程式下載 kevin 晚上9:49 Add Comment Edit 請參考本書附錄APPENDIX A 本書範例程式下載與安裝說明 ,A.3 開啟eclipse PythonProject範例程式: 第14章: RunLogisticRegressionWithSGDBinary.py 第15章: RunNaiveBayesBinar... Read More
第13章 Python Spark MLlib 決策樹二元分類 kevin 晚上8:48 1 Comment Edit 13.4.2 下載StumbleUpon 資料 進入Kaggle 網站的StumbleUpon 頁面。 https://www.kaggle.com/c/stumbleupon/data 13.4.4 複製到專案目錄 Step1. 複製下載檔案至專案data 子目錄 ... Read More
第12章 Python Spark 建立推薦 引擎 kevin 上午9:20 4 Comments Edit 12.4 如何蒐集資料? 網址進入moivelens 網站: http://grouplens.org/datasets/movielens/ Step1. 下載ml-100k 資料 mkdir -p ~/pythonwork/PythonProject/data cd... Read More
本書勘誤表Errata kevin 晚上9:53 2 Comments Edit 133頁 6-5 複製與刪除HDFS 檔案 Step1. 複製HDFS 檔案 >複製HDFS檔案至HDFS測試目錄 原來的內容(紅字為錯誤) hadoop fs -cp /user/hduser/test/README.txt /user/ hadoop /te... Read More
第11章 Python Spark 整合開發 環境介紹 kevin 上午9:19 29 Comments Edit 11.1 下載與安裝eclipse Scala IDE Step1. 瀏覽Scala IDE 網頁 http://scala-ide.org/ 11.2 安裝pyDev Step1. 執行eclipse 程式 輸入工作路徑 /home/hduser/pythonwo... Read More
第10章 Python Spark RDD 介紹 kevin 清晨6:32 Add Comment Edit 10.2 開啟IPython Notebook Step1. 在local 模式執行IPython Notebook 使用Spark cd ~/pythonwork/ipynotebook PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DR... Read More
第9章 在IPython Notebook 執 行Python Spark 程式 kevin 清晨6:09 2 Comments Edit 9.1 安裝Anaconda Step1. 複製安裝Anaconda 下載網址 連結continuum網址 https://repo.continuum.io/archive/index.html Step2. 下載Anaconda2-2.5.0-Linux-x86_6... Read More
第8章 Python Spark 2.0 介紹與 安裝 kevin 清晨6:26 7 Comments Edit 8.1 安裝scala Step1~4 下載安裝 Scala wget http://www.scala-lang.org/files/archive/scala-2.11.6.tgz tar xvf scala-2.11.6.tgz sudo mv scala-2.11.... Read More
第6章. Hadoop HDFS命令介紹 kevin 清晨5:22 1 Comment Edit 書上6.3與6.5節命令有誤,以下已經更正 6.1 啟動Hadoop Multi-Node Cluster start-all.sh 6.2 建立與查看HDFS目錄 Step1 建立HDFS目錄 hadoop fs -mkdir /user hadoop fs -... Read More
第2章與第3章 安裝VirtualBox與Ubuntu kevin 晚上11:58 Add Comment Edit 2.1 VirtualBox下載安裝 下載VirtualBox windows 版本網址 https://www.virtualbox.org/wiki/Downloads 3.1 Ubuntu Linux的作業系統安裝 Ubuntu建議安裝14.04 LTS(此版本作... Read More