×
Hadoop 技術手冊 第二版
作者: Tom White
譯者:王耀聰/辜文元/魏綸毅
書號: a280
出版日: 2011/10/25
ISBN:9789862762967
附件: 無
定價: 880
電子書: 未出版
購買紙本書
內容特色
您該如何釋放海量資料的力量呢?憑藉著本書的綜合資源,您可以學會如何用Apache Hadoop來打造與維護一個可靠而具擴充性的分散式系統。不論是想瞭解如何分析各種資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。本修訂版囊括了Hadoop近期的改變,包括像是Hive、Sqoop與Avro等。本書也提供了一些使用案例,用以說明Hadoop如何被用來解決特定的問題。

.用HDFS(Hadoop Distributed File System)來儲存大型資料集,然後用MapReduce運行分散式運算。
.用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(serialization)與封藏(persistence)。
.探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。
.設計、建立與管理一座專用的Hadoop叢集,或在雲端服務上運行Hadoop。
.運用高階的查詢語言Pig來處理大量資料。
.運用Hadoop的資料倉儲系統Hive來分析資料集。
.運用HBase資料庫來儲存結構化與半結構化資料。
.使用ZooKeeper工具集打造分散式系統。

名人推薦
『現在您擁有一個絕佳機會能向大師學習Hadoop相關知識-不僅包括技術層面,還有基本的觀念,與簡單的對話!』

--Doug Cuttin, Cloudera



作者簡介
Tom White自2007年起就是Apache Hadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章;並在商業研討會上發表多場演講。

譯者簡介
王耀聰
交通大學電機與控制工程碩士,任職於國家高速網路與計算中心,主要專長為分散式系統、感測網路與虛擬實境。因長期致力於自由軟體校園應用研發與推廣,榮獲2008年行政院科技貢獻獎。於2009年起維運hadoop 公用實驗叢集、台灣 hadoop 論壇與台灣 hadoop 使用者社群。目前主要負責校園雲端自由軟體研發與推廣。

辜文元
逢甲大學資訊工程所碩士,任職於逢甲大學地理資訊系統研究中心研究發展部,具有13年的系統分析及資料庫管理經驗,主要專長為系統分析及設計,目前主要負責研發海量級感測器資料解決方案。

魏綸毅
暨南大學資訊工程所碩士,目前從事系統開發及分析設計工作,主要專長為JAVA、.NET Framework及分散式應用程式設計,對軟體開發技術有濃厚興趣,目前擁有Microsoft MCPD、OMG UML OCUP Advanced認證。


章節目錄
chapter 1|遇見Hadoop
chapter 2|MapReduce
chapter 3|Hadoop分散式檔案系統
chapter 4|Hadoop的I/O
chapter 5|開發MapReduce程式
chapter 6|MapReduce如何運作
chapter 7|MapReduce的類型與格式
chapter 8|MapReduce的特性
chapter 9|建立一個Hadoop叢集
chapter 10|Hadoop的管理
chapter 11|Pig
chapter 12|Hive
chapter 13|HBase
chapter 14|ZooKeeper
chapter 15|Sqoop
chapter 16|使用案例
Hadoop 技術手冊 第二版 分享
  • 作者: Tom White
  • 書號:A280
  • ISBN:9789862762967
  • 出版日:2011/10/25
  • 定價:$ 880
  • 電子書:已出版
  • 購買紙本書

    內容特色
    您該如何釋放海量資料的力量呢?憑藉著本書的綜合資源,您可以學會如何用Apache Hadoop來打造與維護一個可靠而具擴充性的分散式系統。不論是想瞭解如何分析各種資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。本修訂版囊括了Hadoop近期的改變,包括像是Hive、Sqoop與Avro等。本書也提供了一些使用案例,用以說明Hadoop如何被用來解決特定的問題。

    .用HDFS(Hadoop Distributed File System)來儲存大型資料集,然後用MapReduce運行分散式運算。
    .用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(serialization)與封藏(persistence)。
    .探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。
    .設計、建立與管理一座專用的Hadoop叢集,或在雲端服務上運行Hadoop。
    .運用高階的查詢語言Pig來處理大量資料。
    .運用Hadoop的資料倉儲系統Hive來分析資料集。
    .運用HBase資料庫來儲存結構化與半結構化資料。
    .使用ZooKeeper工具集打造分散式系統。

    名人推薦
    『現在您擁有一個絕佳機會能向大師學習Hadoop相關知識-不僅包括技術層面,還有基本的觀念,與簡單的對話!』

    --Doug Cuttin, Cloudera



    作者簡介
    Tom White自2007年起就是Apache Hadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章;並在商業研討會上發表多場演講。

    譯者簡介
    王耀聰
    交通大學電機與控制工程碩士,任職於國家高速網路與計算中心,主要專長為分散式系統、感測網路與虛擬實境。因長期致力於自由軟體校園應用研發與推廣,榮獲2008年行政院科技貢獻獎。於2009年起維運hadoop 公用實驗叢集、台灣 hadoop 論壇與台灣 hadoop 使用者社群。目前主要負責校園雲端自由軟體研發與推廣。

    辜文元
    逢甲大學資訊工程所碩士,任職於逢甲大學地理資訊系統研究中心研究發展部,具有13年的系統分析及資料庫管理經驗,主要專長為系統分析及設計,目前主要負責研發海量級感測器資料解決方案。

    魏綸毅
    暨南大學資訊工程所碩士,目前從事系統開發及分析設計工作,主要專長為JAVA、.NET Framework及分散式應用程式設計,對軟體開發技術有濃厚興趣,目前擁有Microsoft MCPD、OMG UML OCUP Advanced認證。


    章節目錄
    chapter 1|遇見Hadoop
    chapter 2|MapReduce
    chapter 3|Hadoop分散式檔案系統
    chapter 4|Hadoop的I/O
    chapter 5|開發MapReduce程式
    chapter 6|MapReduce如何運作
    chapter 7|MapReduce的類型與格式
    chapter 8|MapReduce的特性
    chapter 9|建立一個Hadoop叢集
    chapter 10|Hadoop的管理
    chapter 11|Pig
    chapter 12|Hive
    chapter 13|HBase
    chapter 14|ZooKeeper
    chapter 15|Sqoop
    chapter 16|使用案例