碁峰資訊 -

圖書分類工程/3D繪圖辦公軟體應用作業系統 / 伺服器程式設計/APP開發電腦硬體/創客網頁開發設計影像編修繪圖影音多媒體數位攝影數位生活資料庫/大數據網路/架站人文科普商業管理統計數學檢定認證概論/科技趨勢 Apple

Spark學習手冊

作者： Holden Karau, Andy Konwinski, Patrick We
譯者：許致軒
書號： A466
出版日： 2016/09/01
ISBN：9789864760466
附件：無
定價： 520
電子書：未出版

購買紙本書

內容特色

現今無論在任何領域，資料都逐漸地變大，你該如何有效率的對他們進行處理?此書介紹了Apache Spark，一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark，你可以透過簡易的Python,Java,或是Scala的API進行快速的大量資料處理。

此書為Spark的開發者親自撰寫，可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。

‧讓讀者可以快速地了解Spark，例如：分散式資料集、記憶體快取、以及交互式介面等。
‧利用Spark內建的強大資料庫，包含Spark SQL、Spark Streaming以及MLib。
‧使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
‧學習透過Spark進行交互式、批次、以及串流式的應用程式開發
‧與諸多資料來源進行連接，包含HDFS、HIVE、JSON以及S3
‧學習資料切割以及共享變數等進階議題

“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media

作者介紹

Holden Karau任職於Databricks的軟體開發工程師，活耀於開放原始碼專案，同時也是《Fast Data Processing with Spark》(Packt 出版社)的作者

Andy Konwinski是Databricks的共同創辦人，Apache Spark的提交者。同時也是Apache Mesos專案的共同建立人

Patrick Wendell是Databricks的共同創辦人，Apache Spark的提交者。他也維護許多Spark核心引擎的子專案。

Matei Zaharia是Databricks的CTO以及Apache Spark的建立人，他也因為此專案名列Apache副董事

章節目錄

Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫

延伸閱讀

Hadoop技術手冊第四版

Spark學習手冊分享

作者： Holden Karau, Andy Konwinski, Patrick We

書號：A466

ISBN：9789864760466

出版日：2016/09/01

定價：$ 520

電子書：已出版

購買紙本書

金石堂 MOMO 天瓏博客來

內容特色

現今無論在任何領域，資料都逐漸地變大，你該如何有效率的對他們進行處理?此書介紹了Apache Spark，一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark，你可以透過簡易的Python,Java,或是Scala的API進行快速的大量資料處理。

此書為Spark的開發者親自撰寫，可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。

‧讓讀者可以快速地了解Spark，例如：分散式資料集、記憶體快取、以及交互式介面等。
‧利用Spark內建的強大資料庫，包含Spark SQL、Spark Streaming以及MLib。
‧使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
‧學習透過Spark進行交互式、批次、以及串流式的應用程式開發
‧與諸多資料來源進行連接，包含HDFS、HIVE、JSON以及S3
‧學習資料切割以及共享變數等進階議題

“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media

作者介紹

Holden Karau任職於Databricks的軟體開發工程師，活耀於開放原始碼專案，同時也是《Fast Data Processing with Spark》(Packt 出版社)的作者

Andy Konwinski是Databricks的共同創辦人，Apache Spark的提交者。同時也是Apache Mesos專案的共同建立人

Patrick Wendell是Databricks的共同創辦人，Apache Spark的提交者。他也維護許多Spark核心引擎的子專案。

Matei Zaharia是Databricks的CTO以及Apache Spark的建立人，他也因為此專案名列Apache副董事

章節目錄

Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫

延伸閱讀

Hadoop技術手冊第四版

購買紙本書

內容特色

作者介紹

章節目錄

延伸閱讀

Hadoop技術手冊 第四版

Spark學習手冊 分享

內容特色

作者介紹

章節目錄

延伸閱讀

Hadoop技術手冊第四版

Spark學習手冊分享