資料科學學習手冊|Python資料處理、探索、視覺化與建模實作 Sam Lau, Joseph Gonzalez, Deborah Nolan 書號:A759 「這本書正是我當年提出『資料科學家』這個職稱時,所希望能擁有的一本書。如果您希望投身資料科學/工程、人工智慧,或機器學習領域,就該從這裡開始。」 ── DJ Patil 博士,美國首任首席資料科學家 身為一位有志成為資料科學家的讀者,能夠理解各類組織為何仰賴資料來做出關鍵決策──無論是公司在設計網站、還是市政府在改善公共服務,或者是科學家在致力於阻止疾病擴散。而您也希望具備將雜亂資料整理為可行洞見的能力。我們將這整個過程稱為「資料科學生命週期」:也就是從資料的收集、整理、分析,到導出結論的完整流程。 本書是第一本涵蓋程式設計與統計兩大基礎技能、並貫穿整個資料科學生命週期的書籍。本書的對象包括希望成為資料科學家的人、與資料科學家共事的專業人士,以及希望跨越「技術/非技術」界線的資料分析師。只要具備基本的 Python 程式設計知識,便可學習如何透過業界標準工具(如 pandas)來處理資料: .將感興趣的問題精煉為可透過資料探究的研究問題 .執行資料蒐集,其中可能涉及文字處理、網頁爬蟲等技術 .透過資料清理、探索與視覺化,萃取出有價值的洞見 .學會使用建模來描述資料特性 .推廣研究結果,進行超出資料本身的推論
Statistical Tableau|活用統計模型與科學決策力 Ethan Lang 書號:A782 掌握Tableau,以資料分析驅動決策,發掘真正的商業洞見! 在資料主導決策的時代,面對AI與自動化分析,光有資料、只會做圖表還不夠; 更重要的是,如何判斷資料是否可靠,並將分析轉化為真正有價值的洞見。 本書以Tableau為核心,帶你活用統計模型,驗證分析的可信度,讓資料不只「看起來合理」,而且有依據、有說服力、可以信任。 從統計顯著性、信賴區間到視覺化實務,協助你用科學方法解讀資料,做出更精準的決策。 無論是資料分析師、商業決策者,或希望提升資料判斷力的職場工作者,這本書都能幫助你將分析結果轉化為行動與影響力。 ------------------------------------------------ 「本書涵蓋了你開始在Tableau中運用統計所需的一切。Ethan清楚地帶領讀者了解背後的原理與實作的方法,非常精彩!」—Lorna Brown Data School教練,The Information Lab UK 「這本書結合了Tableau的統計分析功能與資料視覺化的強大表現,為讀者提供一套深入探索資料的有力工具。」 —Christopher Gardner 商業智慧分析主任,密西根大學 在這個以資料驅動的時代,理解統計模型已成為進行有效分析與決策的關鍵。無論是剛入門的新手,還是經驗豐富的使用者,本書都能為您提供必要基礎知識,使您能夠掌握並靈活運用Tableau中使用各種統計模型,在運用模型時更具信心,讓您的分析成果與洞見更容易在組織內獲得認同與採納。 隨著人工智慧不斷促使各行各業產生變革,善用統計模型的能力早已從加分條件,轉變為不可或缺的基本技能。掌握這項能力,將幫助您充分釋放資料的潛能,並透過解讀與應用模型產出的洞見,使您始終保持領先地位。 無論您是資料分析愛好者、資料分析師,還是商業專業人士,本書都將帶來實用技巧與專業信心,協助您在快速變動的資料分析領域中游刃有餘、應對自如。 在本書中,您將會學習到: •在Tableau中建立基礎的統計模型 •驗證分析結果的統計顯著性 •計算並解讀信賴區間 •將統計融入資料視覺化的最佳技巧 •使用R和Python,整合Tableau與外部的分析工具 #Tableau #資料分析 #統計模型 #資料視覺化 #決策分析
Neo4j技術手冊|從規劃到正式部署的圖資料庫實戰 Luanne Misquitta , Christophe Willemsen 書號:A812 「這一本最佳指南將帶你打造可正式部署的 Neo4j 系統。深諳 Neo4j 的實踐專家在書中展示 Neo4j 的優勢,以及潛在陷阱的因應之道。這是圖資料庫專業人員的必讀之作。」 ——Jim Webber,Neo4j 首席科學家 想要提升 Cypher 指令的效能,或利用關聯資料模型來支援實際的商業需求嗎?領先全球的原生圖資料庫 Neo4j 會是你的好幫手!Neo4j 已被廣泛用於偵測詐欺、支援推薦系統、建構知識圖譜,並且支援大規模的資料密集型應用程式。 本書將帶你從概念驗證,一路邁入正式部署。經驗老到的作者 Luanne Misquitta 與 Christophe Willemsen 將協助你在實作過程中做出明智決策。 無論你是開發者、架構師,還是資料專業人員,本書都能讓你做出基於事實的選擇,並避免常見陷阱。互聯的資料與 AI 的重要性正日益增加,現在非常適合打造具備洞察力與長期價值的圖系統。看完本書後,你將學會如何: • 設計既能提升效能,又清楚易懂的資料模型 • 在概念驗證階段做出明智的技術選擇 • 在進入正式環境時重新評估系統設定,並進行必要的調整 • 設定 Neo4j,讓它更可靠、更方便監視與觀察 • 將圖資料整合進企業架構中
Deep Learning 5|生成模型開發實作 斎藤康毅 書號:A789 這是暢銷書系列《Deep Learning》的第5集,本次的主題是「生成模型」。 書中延續此系列的風格,以連貫的故事介紹從「常態分布」到「擴散模型」的技術。你可以累積學到的知識,一步一步練習操作,不斷累積學習成果,最終完成類似「Stable Diffusion」這樣的AI影像生成模型。 技術的有趣之處在於細節,從零開始建構,挑戰各種公式。
因果推論的商業應用:用Python解鎖科技產業的精準行銷 Matheus Facure 書號:A777 🎯 資料驅動時代,行銷決策不再靠直覺,你需要的是──科學證據! ・折扣真的能提高銷售?哪些顧客即使不推也會買? ・無法進行 A/B 測試時,還有哪些方法能推論效果? ・在資源有限的情況下,如何讓每一分行銷預算發揮最大效益? ✔把抽象的因果推論方法,運用到科技產業的真實商業問題上。 ✔教你如何思考模型背後的假設與挑戰,搭配實例分析,真正「用得出來」。 ✔全書以 Python 為實作語言,實務化門檻降低,符合產業主流技術。 ✔幫助行銷人、資料分析師、產品經理,解決真實業務問題。 🚩 最真實的國際讀者讚譽 「對數據科學家來說,這本書直接影響我的工作,充滿『恍然大悟』的時刻!」 「唯一一本將因果推論從數學理論到Python實作、聚焦產業應用的書!」 「適合統計、工程與經濟領域專業人士,完美填補實務缺口!」 🚩 來自專家的推薦 「Matheus寫的這本書,教導您如何從簡單的模型進展到適用於真實資料,並解決重要實際問題的先進方法,是該主題迄今的最佳著作。」 ——Sean J. Taylor,Motif Analytics首席科學家 「這是一本淺顯易懂的因果推論入門書,聚焦於Python資料分析社群最熟悉的工具和應用場景。」 ——Nick Huntington-Klein,經濟學教授、《The Effect: An Introduction to Research Design and Causality》作者 「少數真正符合科技產業實際需求的因果推論書。每一章都處理實際資料中會遇到的問題,並用 Python 從零實作。推薦給任何希望深入理解並實作因果推論的人。」 ──D.G. 哥倫比亞大學《工業資料科學》課程講師、Lyft應用科學家 每增加一美元的線上行銷預算,能吸引多少新顧客?哪些消費者只有在收到折扣券時才會購買商品?該如何制定最佳定價策略?因果推論提供了一種高效方法,幫助您準確評估各種影響因素對商業指標的改變,而這一切只需幾行簡潔的Python程式碼即可實現。 在本書中,作者Matheus Facure深入剖析了因果推論在影響力分析與效果估計上的巨大潛力。無論您是管理人員、資料科學家,還是商業分析師,都將在書中學習到一系列經典的因果推論方法,例如 A/B測試、線性迴歸、傾向分數、合成控制法以及雙重差異法(Difference-in-Differences)。此外,作者也帶您探索現代技術的應用,包括如何利用機器學習進行異質性效應估計。每一種方法都配有具體的產業應用範例,幫助您快速上手。 本書將幫助您: .學習因果推論的基本概念 .將商業問題建構為因果推論問題 .了解偏差會如何干擾因果推論 .認識因果效應如何因人而異 .使用同一顧客在不同行為上的觀察進行因果推論 .在隨機化不可行的情況下,運用地理或切換實驗完成因果分析 .檢視不遵從性偏差和效應減弱
架構資料與機器學習平台|雲端啟動分析與AI驅動的創新 Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner 書號:A776 🔹 全面掌握雲端資料與AI平台設計關鍵 🔹 實戰導向,靈活運用AWS、Azure、Google Cloud、Snowflake、Databricks 🔹 從基礎到進階,打造符合企業需求的現代化資料平台 🔹 強化資料治理,加速AI/ML創新,驅動決策智慧 無論你是資料架構師、工程師,或是希望運用AI強化決策的企業領導者,本書都將成為你打造未來資料與機器學習平台的最佳指南! 在資料驅動的時代,企業該如何善用資料創造價值? 本書由三位資深工程師聯手打造,為雲端架構師與資料專業人士提供了一套清晰完整的解決方案。從雲端資料平台的設計到AI與機器學習的整合,帶您走過資料現代化的每一步。無論是整合分散的資料、實現即時決策,還是利用AI解鎖創新潛力,本書都提供了實用的架構與工具,幫助你在雲端時代保持優勢。 ----------------------------------------------------------- 「本書完整介紹,如何依據企業組織的策略方向,設計與建置現代雲端資料與ML平台的概念、模式與元件。真希望我能在多年前就能讀到這本書。」 —Robert Sahlin,Mathem資料平台主管 所有的雲端架構師都必須知道如何建置資料平台,以賦與企業能夠快速高效地做出資料驅動的決策,並在整個企業範圍內提供智能化服務。本書將展示如何使用AWS、Azure、Google Cloud以及Snowflake與Databricks這類多重雲端工具,設計、建置與現代化雲端原生資料與機器學習平台。 作者Marco Tranquillin、Valliappa Lakshmanan與Firat Tekiner使用真實世界企業架構來說明,內容涵蓋從雲端匯入到啟動整個資料生命週期。你將學到如何轉換、保全與現代化資料倉儲與資料湖這些熟悉的解決方案,也將能充份利用最新的AI/ML模式取得精準且快速的洞見,提升競爭優勢。 你將學會: *設計現代化且安全的雲端原生或混合資料分析與機器學習平台 *透過將企業資料整合到治理良好、可擴充的與彈性的資料平台,加速資料導向的創新。 *民主化存取企業資料,治理業務團隊提取洞見方式與建置AI/ML的能力。 *讓您的企業利用串流管道即時決策 *建置MLOps平台,移往預測性與指示性分析
資料工程基礎|規劃和建構強大、穩健的資料系統 Joe Reis, Matt Housley 書號:A745 🏆🏆🏆 Amazone 400+ 五星好評 🏆🏆🏆 👉 資料領域的必讀書單📚 ,適合IT專業人士和學生,尤其適合希望深入了解資料工程的讀者。 👉 書中提供資料工程的基本和進階概念,對於理解當前和未來的資料工程趨勢和技術非常有幫助。 👉 作者的寫作風格值得讚賞,使用的比喻和舉例能將複雜的概念有效簡化,更易理解。 👉 提供清晰的資料工程生命週期概念,有助提升資料管理和專案管理的能力。 「資料世界發展到現在已經有一段時間。首先從設計師開始,然後是資料庫管理員,接著是首席資訊官,然後是資料架構師。這本書將促使該行業朝著更加成熟和先進的方向發展。對於每一位認真對待自己的專業和職業的人來說,這都是一本必讀之作。」 —Bill Inmon 資料倉儲創建者 「《資料工程基礎》是一本絕佳的入門書籍,涵蓋了資料遷移、處理和管理的相關業務。我要強力推薦給任何想要快速瞭解資料工程或分析方面的人,或者想要填補自己知識漏洞的現有從業人員。」 —Jordan Tigani MotherDuck創始人和首席執行官 / BigQuery創始工程師和共同創始人 過去十年來,資料工程發展迅速,讓許多軟體工程師、資料科學家及分析師渴望全面了解這個領域的全貌。這本實用的書籍將告訴你,如何在資料工程生命週期的框架下,評估並選擇最適合的技術,規劃和建構系統能滿足你的組織與客戶需求的資料系統。 本書作者Joe Reis和Matt Housley將帶您深入瞭解資料工程生命週期,並解說如何把各種雲端技術接合起來,以滿足下游資料消費者的需求。你將瞭解如何應用資料產生、攝取、編排、轉換、儲存和治理等概念,這些概念在任何資料環境中都至關重要,而且與底層技術無關。 本書將助您: ‧掌握資料工程領域的精要與全貌。 ‧使用端到端的最佳實踐框架評估資料工程問題。 ‧正確選擇資料技術、架構和流程,避開誇大的行銷手法。 ‧使用資料工程生命週期來設計和建構強大、穩健的架構。 ‧將資料治理與安全性融入整個資料工程的生命週期。
具成本效益的資料管道 Sev Leonard 書號:A770 開發雲端資料管道的權衡之計 「Sev Leonard的最佳實踐和策略可以為我的雇主節省數百萬美元。對比一本書的價格和閱讀時間而言,這是相當不錯的投資回報。」 —Bar Shirtcliff 軟體工程師 「這就是我們一直在等待的那本書,它為監控、控制和優化高效能雲端資料系統的成本,提供了清晰、有條不紊的指導。」 —Matthew Housley 首席技術長兼《資料工程基礎》的合著者 起初,雲端服務的成本看起來經濟實惠,但很容易在日後演變為一筆巨額開支。這對於開發資料管道的團隊來說是一個挑戰,特別是當技術和工作負載快速變化,而需要不斷重新設計週期,導致在開發、調試和停機方面產生額外的成本支出時,該如何提供可擴展、高度可用的產品,同時兼顧成本控制? 在這本實用指南中,Sev Leonard提供了適用於雲端環境設計下,一種可擴展資料管道的整體方法,幫助您在雲端運算和儲存、管道開發和測試、以及監控之間進行成本效能的權衡之計。透過專注於整個設計過程,資料工程師、軟體開發人員、架構師和管理人員可以交付具有成本效益的高品質產品。本書可以幫助您: ‧透過具有成本意識的服務和智慧設計策略,降低雲端費用支出 ‧調整運算資源規模,在不犧牲效能的情況下,最大限度減少資源浪費 ‧推動資料管道發展防止效能問題,並透過有效監控來快速調試、除錯 ‧設定開發和測試環境,盡可能減少雲端服務依賴性 ‧建立可測試且可擴展的資料管道程式碼,降低開發成本並加速管道演進 ‧透過驗證和測試來提高資料品質和管道運行
資料庫內部原理|深入了解分散式資料系統的運作方式 Alex Petrov 書號:A656 「為了選擇適合的工具來完成工作,我們必須了解其設計背後的概念和演算法。本書是由業界從業者為初學者撰寫的入門書籍,涵蓋了許多相關主題。」 -Michael Klishin RabbitMQ長期貢獻者 「對於任何從事資料庫技術有關的人來說,這是一本必備的書籍,尤其是在需要做出使用哪些系統的決策時。」 -Nate McCall Apache Cassandra貢獻者及PMC主席 在選擇、使用和維護資料庫時,了解其內部原理是必不可少的。然而,隨著當今有許多分散式資料庫和工具可供選擇,往往很難了解每個資料庫提供的功能和它們之間的差異。在這本實用指南中,Alex Petrov將引導開發人員深入了解現代資料庫和儲存引擎內部的概念。 在整本書中,您將探索從眾多書籍、論文、部落格文章及幾個開源資料庫的原始碼中所獲取的相關資料。您將發現,許多現代資料庫中,最重要的區別在於決定儲存結構和資料分散方式的子系統中。 您將深入探討以下內容: ‧儲存引擎:了解儲存分類和分類法,深入研究基於B樹(B-tree-based)和不可變的日誌(immutable log-structured)結構儲存引擎。 ‧儲存建構塊:了解如何使用輔助資料結構組織資料庫檔案,如頁面快取和緩衝池,來建立高效的儲存系統。 ‧分散式系統:逐步學習節點和進程如何連接並建立複雜的通訊模式。 ‧資料庫叢集:探索現代資料庫常用的一致性模型,以及分散式儲存系統如何實現一致性。
資料科學:困難部分 Daniel Vaughan 書號:A772 卓越資料科學的技巧 幫助您在資料科學領域中脫穎而出! 「Daniel再次創作了一部傑作,為資料科學家和業務主管之間搭建了有助創造價值的橋樑。本書就是實現資料科學能獲得商業成功的那本關鍵手冊。」 —Adri Purkayastha BNP Paribas全球AI技術風險主管 「全面涵蓋從經濟學到廣告,甚至是流行病學等多個領域,以及如何實際應用資料科學技術。它開端於大多數書籍結束的地方,深入探討由資料洞察驅動的實際決策過程。是每位資料科學家書架上迫切需要的重要資源。」 —Brett Holleman 自由職業資料科學家 這本實用指南提供了傳統的資料工程和資料科學教育中常被忽略的技術和最佳實務。常見的迷思是,優秀的資料科學家是這個領域中「重大主題」的專家(機器學習和程式設計);但事實上,這些工具僅能帶我們走到一定程度而已。真正能區分頂尖資料科學家與普通資料科學家的,是他們對這些重大主題理解的細微差別,以及他們對商業產生影響的能力。 整體而言,本書內容能使在該領域工作的普通資料科學家和優秀資料科學家產生區別。作者Daniel Vaughan收集、擴展並應用這些技能來創造價值,並培訓來自不同公司和行業的資料科學家。 透過這本書,您將能夠: ‧確保您的資料科學工作流程能創造價值 ‧設計可操作的、及時的、相關的指標 ‧提供引人入勝的敘事,以獲得利益相關者的支持 ‧使用模擬來確保您的機器學習演算法是解決問題的正確工具 ‧識別、修正並預防資料洩漏 ‧透過估算因果效應來了解增量性
精通機器學習|使用Scikit-Learn, Keras與TensorFlow 第三版 Aurélien Géron 書號:A712 建立智慧型系統的概念、工具與技術 「這是一本出色的機器學習資源,包含淺顯易懂的解說,以及豐富的實用技巧。」 —François Chollet Keras作者,《Deep Learning with Python》作者 「本書是運用神經網路來解決問題的絕佳入門資源,涵蓋理論及實踐。推薦給想學習實用機器學習技術的人。」 —Pete Warden TensorFlow行動主管 深度學習在經歷了一系列的突破之後,已經推動了整個機器學習領域的發展。如今,即使是對於這項技術非常陌生的程式設計師,也能夠使用簡單、高效率的工具,寫出能從資料中學習的程式。這本暢銷書使用具體的例子、最少的理論,以及具備生產水準的Python框架(Scikit-Learn、Keras和TensorFlow)來協助你直接瞭解智慧系統的建構概念與工具。 在這本第三版中,作者Aurélien Géron將探索一系列的技術,從簡單的線性回歸開始,逐步發展到深度神經網路。本書包含許多範例程式和習題來幫助活用所學,只要具備一些程式設計經驗即可入門。 ‧使用Scikit-Learn自始至終完成機器學習專案 ‧探索多種模型,包括支援向量機、決策樹、隨機森林,和集成方法 ‧運用無監督學習技術,例如降維、聚類法和異常檢測 ‧深入探討神經網路架構,包括摺積神經網路、遞迴網路、生成對抗網路、自動編碼器、擴散模型、轉換器 ‧使用TensorFlow和Keras建構和訓練神經網路,以進行計算機視覺、自然語言處理、生成模型和深度強化學習
資料治理技術手冊 Evren Eryurek等 書號:A746 實現資料可信度的人員、流程和工具 「現今組織產生的資料量和種類比以往任何時候都來得多,企業需要更加了解手中的資料並為未來趨勢做好準備,他們必須採行現代資料治理方式—透過事先設計而不是事後才想到。」 —Jim Cushman, Collibra產品長 當您將資料移動到雲端時,對於資料該如何治理,您需要考慮全面的管理方法,以及定義明確且利益相關者皆有相同共識的策略,以確保您的組織滿足合規性要求。資料治理結合了人員、流程和技術協同工作的方式,以確保資料值得信賴並且可以有效使用。本實務指南向您展示如何在整個組織中實施和擴展資料治理。 首席資訊長、資料長和資訊安全長及其團隊將學習戰略和工具,以支持資料民主化並釋放其價值,同時執行安全、隱私和其他治理標準。通過良好的資料治理,您可以激發客戶信任,使您的組織能夠確定業務效率,產生更具競爭力的產品,並改善客戶體驗。這本書會教你怎樣做。 您會學到: ‧針對人員、流程和工具的資料治理策略 ‧基於雲端服務的資料治理方法的優勢和挑戰 ‧從資料擷取到資料準備和使用,資料治理是如何進行的 ‧如何對資料質量做持續性改進 ‧治理串流資料的挑戰和技術 ‧針對身份驗證、安全、備份和監控的資料保護 ‧如何在您的組織中建立資料文化
Python資料科學學習手冊 第二版 Jake VanderPlas 書號:A727 處理大量資料的基本工具 「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。 對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。 藉由本書,你將可以學習到: ‧IPython和Jupyter:提供資料科學家使用的Python計算環境 ‧NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys ‧Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 ‧Matplotlib:在Python中進行彈性範圍的資料視覺化功能 ‧Scikit-Learn:提供機器學習演算法以及簡潔的Python實作
資料視覺化|使用Python與JavaScript 第二版 Kyran Dale 書號:A726 擷取、清理、分析與轉換資料 「Kyran的書包含了大量資訊,從D3.js細節說明,到如何建構出由客製化互動式儀表板所使用的、且由資料庫所支持的API。可以肯定地說,您將從這本書中學到很多東西!」 —Peter Cook, 《D3 Start to Finish》作者 如何將原始、未經處理的資料轉化為動態的互動式web視覺化?在這本實用的書中,作者Kyran Dale向資料科學家、分析師以及Python、JavaScript開發人員,展示如何為工作建立理想的工具鏈。藉由提供引人入勝的範例以及分享得之不易的實務經驗,本書將引導您善用最佳的Python和JavaScript程式庫。 Python為爬取、清理和處理資料提供強大、成熟的程式庫。在web視覺化程式設計方面,JavaScript是最好的語言。這兩種語言相得益彰,可以幫助您建立現代web視覺化工具鏈。 您將學習如何: ‧使用爬取或web API(Requests、Scrapy、Beautiful Soup)獲取資料 ‧在NumPy生態系統(帶有pandas、Matplotlib和Seaborn的Jupyter notebook)中使用Python資料處理程式庫清理和處理資料 ‧使用靜態檔案或輕量級Python伺服器(Flask RESTful API)將資料交付到瀏覽器 ‧掌握足夠的web開發技能(HTML、CSS、JavaScript)將資料視覺化 ‧使用挖掘和精煉資料建立web圖表和視覺化(Plotly、D3)
Google Analytics學習手冊 Mark Edmondson 書號:A725 創造商業影響力與洞察先機 「藉助Google Analytics的學習過程,熟悉這個數位行銷道具箱裡的每項工具,不僅能了解手上的資料、活化資料,還能創造出自己的競爭優勢,推動價值與成長。」 —Melinda Schiera, 策略分析師 在數位行銷分析領域裡,當前最新的資料模型非Google Analytics 4莫屬,因為GA4不只回報已經發生的事,新增的雲端整合功能還可以活用更多的資料,橫跨所有資料串流,串接線上與離線資料,提供點對點的行銷資料。這本實用手冊還會示範GA4如何支援這些新增的雲端整合功能,幫助讀者做好準備,迎向數位行銷的未來。 本書作者Mark Edmondson是Google Analytics和Google Cloud的開發專家,他針對GA4及其雲端整合應用,提供簡要但全面的入門介紹。資料、商業與行銷分析人員可以從本書學到GA4新的分析模式裡幾個強大的主要面向,主題包含資料架構與策略,資料擷取、儲存和建模,探索幾個常見的資料活用使用案例,指引分析人員實作案例時需要的步驟。 讀者將從本書學到: ‧Google雲端平台如何結合GA4 ‧GA4能與哪些使用案例結合 ‧建立GA4整合應用時需要哪些技術和資源 ‧啟用使用案例時,GA4必須先擷取多少資料 ‧設計資料流的程序,從策略到資料儲存、建模與活化 ‧如何調整使用案例,以符合自身的業務需求
Python資料分析 第三版 Wes McKinney 書號:A709 使用pandas、NumPy和Jupyter進行資料整理 「Wes更新了這本新版本的內容,確保它是學習Python和pandas資料分析知識的首選資源。再多的言語都無法形容我是多麼推薦這本書。」 —Paul Barry 講師及O’Reilly《深入淺出Python》作者 這本權威的手冊將教你如何在Python中操作、處理、清理、整理資料組。第三版配合Python 3.10和pandas 1.4進行更新,用豐富的案例研究教你如何有效地解決廣泛的資料分析問題。在過程中,你將學會最新版的pandas、NumPy和Jupyter。 作者Wes McKinney是Python pandas專案的創始人,在這本書中,以實用和現代化的方式介紹Python資料科學工具組,本書非常適合剛接觸Python的分析師,以及剛接觸資料科學和科學計算的Python程式設計師。本書在GitHub提供資料檔案與相關素材。 ‧使用IPython shell和Jupyter Notebook進行探索性計算 ‧學習NumPy基礎和進階功能 ‧認識pandas程式庫的資料分析工具 ‧使用靈活的工具進行載入、清理、轉換、合併與重塑資料 ‧用matplotlib製作資訊豐富的視覺化圖表 ‧運用pandas的groupBy工具對資料進行切割與彙總 ‧分析與處理正規和非正規的時間序列資料 ‧透過詳盡的範例學習如何解決真正的資料分析問題
ColorWise|用顏色說故事 Kate Strachnyi 書號:A733 「在全球各地的企業中,顏色的不當運用屢見不鮮,每天都在影響資料的閱讀和理解。正確使用顏色能將資料敘事和儀表板設計推向新的高度。Kate Strachnyi在本書中整合了你需要掌握的色彩運用知識和觀念,有助於提升資料視覺化的成果。」 — Bernard Marr,暢銷書《Data Strategy》作者 在當今商業領域,資料被譽為最具威力的工具,因此,有效地呈現資料故事變得至關重要。然而,在資料視覺化過程中,「顏色」這一關鍵資訊傳遞要素卻經常被忽略。在本書中,DATAcated創辦人Kate Strachnyi為讀者呈現了一份關於圖表、表格和資訊圖表中顏色運用的終極指南。 本書內容實用且具啟發性,非常適合資料分析師、商業分析師、資料科學家以及從事資訊圖表和資料視覺化設計的專業人士。書中深入探討了顏色運用的技巧和訣竅,包括色彩背後的理論、各種色彩搭配的效果與成因。此外,本書還涵蓋了顏色的心理學、歷史和文化等多方面知識,更是學習如何運用顏色提升資料敘事技巧和儀表板設計的絕佳教材。 本書會帶給你: ‧深入了解色彩學在資料視覺化和敘事中所扮演的角色 ‧掌握各種有助於改善資料視覺化效果的顏色運用技巧 ‧明白顏色如何影響觀眾對資料視覺化內容的理解 ‧學會巧妙地搭配顏色,並有效引導觀者的閱讀方式 ‧掌握使色覺缺陷者也能輕鬆閱讀的顏色應用技巧 ‧學會如何將本書的原則應用於專案中 Kate Strachnyi是 DATAcated公司的創辦人,為數據公司提供品牌加值服務。她曾主持過眾多與資料敘事、儀表板設計技巧以及視覺最佳實務範例等相關的課程和演講。亦曾主辦DATAcated研討會,吸引了數千名資料專業人士參加,並主持《DATAcated On Air》podcast頻道。Kate分別在2018年和2019年被評選為LinkedIn資料科學與分析領域的頂尖聲音(Top Voices)之一。
Deep Learning 4|用Python進行強化學習的開發實作 斎藤康毅 書號:A720 本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。 從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
數據網格|大規模提供資料驅動價值 Zhamak Dehghani 書號:A713 「一本「將數據視為產品」全面且重要的介紹,包括達成此目標所需的文化、流程、技術和團隊變革。」 Manuel Pais 《Team Topologies》共同作者 「Zhamak詳細說明Data Mesh方法,讓這個新概念清晰且實用。」 Gwen Shapira Nile Platform共同創辦人與產品長,《Kafka: The Definitive Guide》作者 我們正處於數據的轉捩點。組織的複雜度、資料來源的激增及期望使用AI和資料分析來從數據取得價值等原因,已經讓目前的數據管理解決方案無法應對。在這本實用書中,作者Zhamak Dehghani介紹了數據網格,這是從現代化分散式架構描繪出的去中心化的社會技術典範,提供一種新的方法,規模化的獲取分析數據的來源、分享、存取和管理。 作者引導從業人員、架構師、技術主管和決策者,讓他們從傳統的大數據架構順利走向分散式、多維度的分析數據管理方法。數據網格將數據視為產品,將領域視為主要考量,套用平台思考模式來建立自我服務的數據基礎設施,同時介紹數據治理的聯合計算模型。 ‧完整介紹數據網格的原則與內容 ‧設計數據網格的架構 ‧引導數據網格的策略與執行 ‧引領組織設計去中心化的數據所有權模型 ‧將傳統資料倉儲與資料湖泊轉移到分散式數據網格
金融風險管理的機器學習應用|使用Python Abdullah Karasan 書號:A698 風險建模演算法 「Abdullah Karasan成功展現了在金融風險管理領域中使用機器學習的能力,這是對任何金融機構都攸關重要的功能。」 —Yves J. Hilpisch博士 The Python Quants與The AI Machine創辦人及總裁 「如果您需要將統計和機器學習方法應用在金融風險分析的入門指南,那麼這是一個很好的起點。」 —Graham L. Giller 《Adventures in Financial Data Science》作者 金融風險管理在人工智慧的幫助下發展迅速。透過這本實用指南,開發人員、程式設計師、工程師、金融分析師、風險分析師及定量和演算法分析師,將可以機器學習和深度學習模型進行金融風險評估。建立基於人工智慧的財務建模實務技能後,您將學習要如何運用機器學習模型來取代傳統的金融風險模型。 作者Abdullah Karasan幫助您探索金融風險建模背後的理論,再深入研究使用Python運用機器學習模型以對金融風險進行建模的實際方法。 有了這本書,您將可以: ‧回顧經典的時間序列應用並將其與深度學習模型進行比較 ‧使用支撐向量迴歸、神經網路和深度學習來探索波動率模型以衡量風險程度 ‧使用機器學習技術來改善市場風險模型(VaR和ES),並包括了流動性維度 ‧使用分群和貝氏方法來進行信用風險分析 ‧使用高斯混合模型和關聯結構模型來捕捉流動性風險的不同面向 ‧使用機器學習模型來進行詐欺偵測 ‧使用機器學習模型來預測股價崩盤並識別其決定因素
機器學習模擬應用|將合成資料運用於AI Paris and Mars Buttfield-Addison, Tim Nugent & Jon Manning 書號:A715 「在資料需求很高但可存取資料稀少的時代,建立逼真的模擬環境以產生更強大的研究和ML應用程式將比以往任何時候都更加重要。本書對於機器學習和Unity開發人員來說是進入該領域的最佳途徑。」 —Dominic Monn 機器學習工程師 模擬和合成將是人工智慧和機器學習的未來核心。想像一下,程式設計師、資料科學家和機器學習工程師可以在沒有汽車的情況下建立自動駕駛汽車的大腦。您可以使用模擬來合成人工資料訓練傳統的機器學習模型,而不是使用實際的資訊。這只是開始而已。 透過這本實用的書,您將探索基於模擬和合成的機器學習和AI的可能性,重點是深度強化學習和模仿學習技術。AI和ML是藉由資料來驅動,而模擬是釋放它們全部潛力的強大且引人入勝的方式。 您將學習如何: ‧使用Unity引擎的模擬來設計解決ML和AI問題的方法 ‧使用遊戲引擎合成影像以用作訓練資料 ‧建立用來訓練深度強化學習和模仿學習模型的模擬環境 ‧為基於模擬的ML來使用和應用有效率的通用演算法,例如近端策略優化 ‧使用不同的方法來訓練各種ML模型 ‧使用PyTorch和Unity ML-Agents和Perception Toolkits來讓ML工具能夠與業界標準的遊戲開發工具一起使用
SQL學習手冊 第三版|資料建立、維護與檢索 Alan Beaulieu 書號:A705 「本書提供了當代資料庫世界中你應當瞭解關於SQL的一切事物,從SQL的基本概念到分析用函式及大型資料庫操作等進階題材。」 —Mark Richards,《軟體架構原理》(歐萊禮出版)作者 當資料如潮水般湧入企業內部,你需要立即讓它們派上用場時,SQL就是最佳的利器。這本最新版的入門指南可以協助您迅速掌握SQL的基礎知識,以便撰寫資料庫應用程式、執行管理作業、並製作報表。讀者們還會看到新加入的章節,涵蓋分析用函式、操作大型資料庫的策略、以及SQL與大數據的關係與進展。 每一章專注於一項SQL的關鍵概念或技術,佐以大量的說明和註解清晰的範例。章節最後的習題可以讓你立即練習剛剛學到的技巧,檢驗學習成效。瞭解SQL是操作資料的必備技能。藉由本書,你將能迅速學會如何發揮此種語言的威力及彈性。 .迅速掌握SQL的基本知識與進階功能 .以SQL的資料敘述來產生、操作及取得資料 .以SQL的架構敘述建立資料表、索引及約束條件等資料庫物件 .學習如何以查詢語句操作資料集合;理解子查詢的重要性 .以SQL的內建函式轉換及操作資料,並在資料敘述中運用條件邏輯
從機器學習到人工智慧|寫給Android/iOS程式師的ML/AI開發指南 Laurence Moroney 書號:A701 幫助Android/iOS開發者了解如何應用AI/機器學習技術開發app 如果無處可用,AI什麼都不是。在人手一機的時代裡,如何應用AI已經成為行動裝置App開發人員的必修課程。本書是你在主流行動裝置平台(iOS與Android)上應用機器學習技術開發相關app的最佳指南。 本書介紹機器學習的相關技術與工具,並引導你應用ML Kit、TensorFlow Lite與Core ML等工具,開發電腦視覺與文字辨識等應用機器學習技術的Android/iOS應用程式。 .介紹可以應用在行動裝置上的AI/ML相關技術 .建立為iOS和Android的機器學習模型 .應用ML Kit與TensorFlow Lite開發Android/iOS應用程式 .如何依據需求選擇技術與工具,如雲端或裝置端的取捨,以及API的選擇 .了解機器學習技術應用的上的隱私與道德考量
電腦視覺機器學習實務|建立端到端的影像機器學習 Valliappa Lakshmanan, Martin Görner, Ryan Gillard 書號:A700 「本書全面介紹深度電腦視覺的最先進作法,在Keras中建構端到端生產系統,提供經過實戰檢驗的最佳實務解決方案。」 —François Chollet 深度學習研究者和Keras創造者 這本實用指南向您展示了如何使用機器學習模型從影像中淬取資訊。ML工程師和資料科學家將會學習經過驗證的ML技術來解決各種影像問題,包括分類、物件偵測、自編碼器、影像產生、計數和圖說產生。本書卓越的介紹了端到端深度學習:資料集建立、資料前置處理、模型設計、模型訓練、評估、部署和可解釋性。 Google工程師Valliappa Lakshmanan、Martin Görner和Ryan Gillard向您展示了如何開發準確且可解釋的電腦視覺ML模型,並使用強大的ML架構以靈活且可維護的方式將它們投入大規模生產。您將學習如何使用以TensorFlow和Keras編寫的模型進行設計、訓練、評估和預測。 您將學習如何: ‧為電腦視覺任務設計機器學習架構 ‧選擇適合您的任務的模型(例如ResNet、SqueezeNet或EfficientNet) ‧建立端到端ML生產線來訓練、評估、部署和解釋您的模型 ‧前置處理影像以進行資料擴增進行並支援可學習性 ‧納入可解釋性和負責任的AI的最佳實務 ‧將影像模型部署為Web服務或在邊緣設備上 ‧監控和管理機器學習模型
金融機器學習與資料科學藍圖 Hariom Tatsat, Sahil Puri, Brad Lookabaugh 書號:A676 從建構交易策略到使用Python的機器人投資顧問 機器學習和資料科學將在未來幾年顯著改變金融業。透過本實用指南,避險基金、投資和零售銀行以及金融科技公司的專業人士將學到如何建構對該行業極為關重要的ML演算法。您將研究ML概念和20多個案例研究,包括了監督式、非監督式和強化學習,以及自然語言處理(natural language processing, NLP)。 分析師、交易員、研究人員和開發人員還將深入研究投資組合管理、演算法交易、衍生性商品定價、詐欺偵測、資產價格預測、情緒分析和聊天機器人開發。您將探索現實生活中的問題,並學習以程式碼和範例作為後盾的科學上合理的解決方案。 本書包括: ‧基於迴歸的監督式學習交易策略和衍生性商品定價模型 ‧基於分類的監督式學習信用違約風險預測與詐欺偵測模型 ‧投資組合管理與收益率曲線建構中的降維技術及實例研究 ‧利用演算法和分群技術尋找交易策略和投資組合管理中相似物件的案例研究 ‧建立交易策略的強化學習模型和技巧,衍生性商品避險和投資組合管理 ‧使用Python函式庫(例如NLTK和Scikit-learn)的NLP技術
TensorFlow.js學習手冊 Gant Laborde 書號:A682 以JavaScript開發機器學習 「Gant在這本書中開門見山的教導您,網頁開發者使用JavaScript和瀏覽器需要知道的重要知識。」 —Laurence Moroney AI倡議領導者, Google 「《TensorFlow.js學習手冊》讓您可以邁入TensorFlow.js,讓所有JavaScript開發者獲得新一代網頁應用開發的超能力。" —Jason Mayes Google TensorFlow.js資深工程師 「Gant神奇的解釋了複雜的機器學習概念,避免過於複雜的數學陷阱,您很難再找到更好的JavaScript資料科學介紹了。」 —Lee Warrick 全端JavaScript開發者 鑑於對AI的需求和JavaScript的無所不在,TensorFlow.js的狂潮是不可避免的。借由這個Google框架,可以協助經驗豐富的AI老手和Web開發人員推動AI驅動網站的未來發展。在這本指南中,作者Gant Laborde(機器學習與web領域,Google開發人員及專家)為資料科學家、工程師、web開發人員、學生和研究人員等廣大技術受眾,提供了TensorFlow.js實務操作基礎方法。 您將首先學習TensorFlow.js中的一些基本範例,再深入研究神經網路架構、DataFrames、TensorFlow Hub、模型轉換、遷移學習等。讀完本書後,您將瞭解如何使用TensorFlow.js建構和部署產出就緒的深度學習系統。 ‧探索張量(tensors),機器學習的最基本結構 ‧使用真實範例將資料轉換為張量及返回 ‧使用TensorFlow.js將AI與web相結合 ‧使用資源來轉換、訓練和管理機器學習資料 ‧從頭開始建構和訓練您自己的訓練模型
精通資料分析|使用Excel、Python和R George Mount 書號:A697 資料分析聽起來很難,但只要你會用Excel,其實就不難上手了。透過這本實作指南,能夠幫助你更進一步地理解資料分析與處理,並瞭解如何藉助程式語言進行資料分析與假說檢定。 資料分析的重點是找出關聯性,本書可以引導你學到更進階的資料分析技術。本書運用試算表作為練習基礎統計學概念的範例,並告訴你如何運用Python與R進行更有效率的資料分析。 這本實用指南可以幫助你: .了解如何利用Excel進行資料分析:透過Excel來測試變數之間的關係,並運用統計學製作令人信服的分析 .從Excel到R:學會如何使用R進行原本利用Excel所進行的資料分析工作 .從Excel到Python:學會如何應用Python進行原本利用Excel所進行的資料分析工作 專家推薦 「本書精確地說明如何運用Excel進行資料科學與分析的工作」--Jordan Goldmeier, 微軟Excel MVP 「這本書不僅可以作為商業和資料分析的參考資料,也可以作為入門教材」--Aiden Johnson, 資料科學家
精通資料視覺化 Jack Dougherty, Ilya Ilyankou 書號:A688 用試算表和程式說故事 「關於資料視覺化,你需要知道的一切,都在這本書裏頭了!」 - Derek Eder Partner, DataMade 《精通資料視覺化》將告訴你如何設計可用於網站上的互動式圖表和定製地圖,只要利用Google試算表、Datawrapper和Tableau Public這類的工具就能辦到。我們還會告訴你,如何套用GitHub上的Chart.js、Highcharts和Leaflet等開源模板。 本書利用真實世界的案例與網路資源,一步步引導你學會如何將資料視覺化,即使沒有任何程式設計經驗也能辦得到。 .構建互動式圖表和地圖並將其嵌入你的網站中 .理解設計有效圖表和地圖的原則 .學習關鍵的數據可視化概念以幫助你選擇正確的工具 .轉換和變換表格和空間數據,講述你的資料故事 .在GitHub上編輯和託管Chart.js、Highcharts和Leaflet地圖程式模板 .學習如何檢測他人製作的圖表和地圖中的偏差