Spark SQL大數據資料統計與視覺化

Spark SQL是Spark大數據處理架構,所提供最簡易使用的大數據資料處理介面,可以針對不同格式的資料。執行ETL : 萃取(extract)、轉置(transform)、載入(load)操作。


以上內容節錄自這本書,本書將詳細介紹Spark 2.0 安裝,並且所有Python範例程式都能在Spark 2.0 執行。並且特別介紹Spark 2.0 以DataFrame為基礎的Spark ML pipeline機器學習套件。很適合入門初學者:
  Python+Spark 2.0+Hadoop機器學習與大數據分析實戰 http://pythonsparkhadoop.blogspot.tw/2016/10/pythonspark-20hadoop.html

《購買本書 限時特價專區》
博客來:http://www.books.com.tw/products/0010730134?loc=P_007_090  

天瓏:https://www.tenlong.com.tw/items/9864341537?item_id=1023658
露天拍賣:http://goods.ruten.com.tw/item/show?21640846068139
蝦皮拍賣:https://goo.gl/IEx13P 



Share on Google Plus

About kevin

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

1 意見:

  1. 我有"Python+Spark 2.0+Hadoop機器學習與大數據分析實戰"這本書,請問書中程式碼在哪可以下載?或可以email ( ccshih@mail.shu.edu.tw ) 給我?
    謝謝。

    回覆刪除