Spark 2.0 ML Pipeline機器學習流程介紹

Spark ML Pipeline是Spark 2.0可以用於構建複雜機器學習工作流程的程式庫,它從Spark 1.2版本就開始發展,經過幾個版本的發展,到了Spark 2.0已經是未來主要發展的機器學習架構。本文將詳細地介紹Spark ML Pipeline的設計思想和基本概念,以及如何使用ML Pipeline提供的API程式庫。相信經過本文的說明,讀者可以較為深入的了解ML Pipeline,進而將它運用解決更多複雜的大數據問題。

以上內容節錄自這本書,本書將詳細介紹Spark 2.0 安裝,並且所有Python範例程式都能在Spark 2.0 執行。並且特別介紹Spark 2.0 以DataFrame為基礎的Spark ML pipeline機器學習套件。很適合入門初學者:
  Python+Spark 2.0+Hadoop機器學習與大數據分析實戰 http://pythonsparkhadoop.blogspot.tw/2016/10/pythonspark-20hadoop.html

《購買本書 限時特價專區》
博客來:http://www.books.com.tw/products/0010730134?loc=P_007_090  

天瓏:https://www.tenlong.com.tw/items/9864341537?item_id=1023658
露天拍賣:http://goods.ruten.com.tw/item/show?21640846068139
蝦皮拍賣:https://goo.gl/IEx13P 



Share on Google Plus

About kevin

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

0 意見:

張貼留言