顯示模式:
封面

資料科學學習手冊|Python資料處理、探索、視覺化與建模實作

書號:A759

「這本書正是我當年提出『資料科學家』這個職稱時,所希望能擁有的一本書。如果您希望投身資料科學/工程、人工智慧,或機器學習領域,就該從這裡開始。」 ── DJ Patil 博士,美國首任首席資料科學家 身為一位有志成為資料科學家的讀者,能夠理解各類組織為何仰賴資料來做出關鍵決策──無論是公司在設計網站、還是市政府在改善公共服務,或者是科學家在致力於阻止疾病擴散。而您也希望具備將雜亂資料整理為可行洞見的能力。我們將這整個過程稱為「資料科學生命週期」:也就是從資料的收集、整理、分析,到導出結論的完整流程。 本書是第一本涵蓋程式設計與統計兩大基礎技能、並貫穿整個資料科學生命週期的書籍。本書的對象包括希望成為資料科學家的人、與資料科學家共事的專業人士,以及希望跨越「技術/非技術」界線的資料分析師。只要具備基本的 Python 程式設計知識,便可學習如何透過業界標準工具(如 pandas)來處理資料: .將感興趣的問題精煉為可透過資料探究的研究問題 .執行資料蒐集,其中可能涉及文字處理、網頁爬蟲等技術 .透過資料清理、探索與視覺化,萃取出有價值的洞見 .學會使用建模來描述資料特性 .推廣研究結果,進行超出資料本身的推論

封面

Statistical Tableau|活用統計模型與科學決策力

書號:A782

掌握Tableau,以資料分析驅動決策,發掘真正的商業洞見! 在資料主導決策的時代,面對AI與自動化分析,光有資料、只會做圖表還不夠; 更重要的是,如何判斷資料是否可靠,並將分析轉化為真正有價值的洞見。 本書以Tableau為核心,帶你活用統計模型,驗證分析的可信度,讓資料不只「看起來合理」,而且有依據、有說服力、可以信任。 從統計顯著性、信賴區間到視覺化實務,協助你用科學方法解讀資料,做出更精準的決策。 無論是資料分析師、商業決策者,或希望提升資料判斷力的職場工作者,這本書都能幫助你將分析結果轉化為行動與影響力。 ------------------------------------------------ 「本書涵蓋了你開始在Tableau中運用統計所需的一切。Ethan清楚地帶領讀者了解背後的原理與實作的方法,非常精彩!」—Lorna Brown Data School教練,The Information Lab UK 「這本書結合了Tableau的統計分析功能與資料視覺化的強大表現,為讀者提供一套深入探索資料的有力工具。」 —Christopher Gardner 商業智慧分析主任,密西根大學 在這個以資料驅動的時代,理解統計模型已成為進行有效分析與決策的關鍵。無論是剛入門的新手,還是經驗豐富的使用者,本書都能為您提供必要基礎知識,使您能夠掌握並靈活運用Tableau中使用各種統計模型,在運用模型時更具信心,讓您的分析成果與洞見更容易在組織內獲得認同與採納。 隨著人工智慧不斷促使各行各業產生變革,善用統計模型的能力早已從加分條件,轉變為不可或缺的基本技能。掌握這項能力,將幫助您充分釋放資料的潛能,並透過解讀與應用模型產出的洞見,使您始終保持領先地位。 無論您是資料分析愛好者、資料分析師,還是商業專業人士,本書都將帶來實用技巧與專業信心,協助您在快速變動的資料分析領域中游刃有餘、應對自如。 在本書中,您將會學習到: •在Tableau中建立基礎的統計模型 •驗證分析結果的統計顯著性 •計算並解讀信賴區間 •將統計融入資料視覺化的最佳技巧 •使用R和Python,整合Tableau與外部的分析工具 #Tableau #資料分析 #統計模型 #資料視覺化 #決策分析

封面

Neo4j技術手冊|從規劃到正式部署的圖資料庫實戰

書號:A812

「這一本最佳指南將帶你打造可正式部署的 Neo4j 系統。深諳 Neo4j 的實踐專家在書中展示 Neo4j 的優勢,以及潛在陷阱的因應之道。這是圖資料庫專業人員的必讀之作。」 ——Jim Webber,Neo4j 首席科學家 想要提升 Cypher 指令的效能,或利用關聯資料模型來支援實際的商業需求嗎?領先全球的原生圖資料庫 Neo4j 會是你的好幫手!Neo4j 已被廣泛用於偵測詐欺、支援推薦系統、建構知識圖譜,並且支援大規模的資料密集型應用程式。 本書將帶你從概念驗證,一路邁入正式部署。經驗老到的作者 Luanne Misquitta 與 Christophe Willemsen 將協助你在實作過程中做出明智決策。 無論你是開發者、架構師,還是資料專業人員,本書都能讓你做出基於事實的選擇,並避免常見陷阱。互聯的資料與 AI 的重要性正日益增加,現在非常適合打造具備洞察力與長期價值的圖系統。看完本書後,你將學會如何: • 設計既能提升效能,又清楚易懂的資料模型 • 在概念驗證階段做出明智的技術選擇 • 在進入正式環境時重新評估系統設定,並進行必要的調整 • 設定 Neo4j,讓它更可靠、更方便監視與觀察 • 將圖資料整合進企業架構中

封面

Deep Learning 5|生成模型開發實作

書號:A789

這是暢銷書系列《Deep Learning》的第5集,本次的主題是「生成模型」。 書中延續此系列的風格,以連貫的故事介紹從「常態分布」到「擴散模型」的技術。你可以累積學到的知識,一步一步練習操作,不斷累積學習成果,最終完成類似「Stable Diffusion」這樣的AI影像生成模型。 技術的有趣之處在於細節,從零開始建構,挑戰各種公式。

封面

因果推論的商業應用:用Python解鎖科技產業的精準行銷

書號:A777

🎯 資料驅動時代,行銷決策不再靠直覺,你需要的是──科學證據! ・折扣真的能提高銷售?哪些顧客即使不推也會買? ・無法進行 A/B 測試時,還有哪些方法能推論效果? ・在資源有限的情況下,如何讓每一分行銷預算發揮最大效益? ✔把抽象的因果推論方法,運用到科技產業的真實商業問題上。 ✔教你如何思考模型背後的假設與挑戰,搭配實例分析,真正「用得出來」。 ✔全書以 Python 為實作語言,實務化門檻降低,符合產業主流技術。 ✔幫助行銷人、資料分析師、產品經理,解決真實業務問題。 🚩 最真實的國際讀者讚譽 「對數據科學家來說,這本書直接影響我的工作,充滿『恍然大悟』的時刻!」 「唯一一本將因果推論從數學理論到Python實作、聚焦產業應用的書!」 「適合統計、工程與經濟領域專業人士,完美填補實務缺口!」 🚩 來自專家的推薦 「Matheus寫的這本書,教導您如何從簡單的模型進展到適用於真實資料,並解決重要實際問題的先進方法,是該主題迄今的最佳著作。」 ——Sean J. Taylor,Motif Analytics首席科學家 「這是一本淺顯易懂的因果推論入門書,聚焦於Python資料分析社群最熟悉的工具和應用場景。」 ——Nick Huntington-Klein,經濟學教授、《The Effect: An Introduction to Research Design and Causality》作者 「少數真正符合科技產業實際需求的因果推論書。每一章都處理實際資料中會遇到的問題,並用 Python 從零實作。推薦給任何希望深入理解並實作因果推論的人。」 ──D.G. 哥倫比亞大學《工業資料科學》課程講師、Lyft應用科學家 每增加一美元的線上行銷預算,能吸引多少新顧客?哪些消費者只有在收到折扣券時才會購買商品?該如何制定最佳定價策略?因果推論提供了一種高效方法,幫助您準確評估各種影響因素對商業指標的改變,而這一切只需幾行簡潔的Python程式碼即可實現。 在本書中,作者Matheus Facure深入剖析了因果推論在影響力分析與效果估計上的巨大潛力。無論您是管理人員、資料科學家,還是商業分析師,都將在書中學習到一系列經典的因果推論方法,例如 A/B測試、線性迴歸、傾向分數、合成控制法以及雙重差異法(Difference-in-Differences)。此外,作者也帶您探索現代技術的應用,包括如何利用機器學習進行異質性效應估計。每一種方法都配有具體的產業應用範例,幫助您快速上手。 本書將幫助您: .學習因果推論的基本概念 .將商業問題建構為因果推論問題 .了解偏差會如何干擾因果推論 .認識因果效應如何因人而異 .使用同一顧客在不同行為上的觀察進行因果推論 .在隨機化不可行的情況下,運用地理或切換實驗完成因果分析 .檢視不遵從性偏差和效應減弱

封面

架構資料與機器學習平台|雲端啟動分析與AI驅動的創新

書號:A776

🔹 全面掌握雲端資料與AI平台設計關鍵 🔹 實戰導向,靈活運用AWS、Azure、Google Cloud、Snowflake、Databricks 🔹 從基礎到進階,打造符合企業需求的現代化資料平台 🔹 強化資料治理,加速AI/ML創新,驅動決策智慧 無論你是資料架構師、工程師,或是希望運用AI強化決策的企業領導者,本書都將成為你打造未來資料與機器學習平台的最佳指南! 在資料驅動的時代,企業該如何善用資料創造價值? 本書由三位資深工程師聯手打造,為雲端架構師與資料專業人士提供了一套清晰完整的解決方案。從雲端資料平台的設計到AI與機器學習的整合,帶您走過資料現代化的每一步。無論是整合分散的資料、實現即時決策,還是利用AI解鎖創新潛力,本書都提供了實用的架構與工具,幫助你在雲端時代保持優勢。 ----------------------------------------------------------- 「本書完整介紹,如何依據企業組織的策略方向,設計與建置現代雲端資料與ML平台的概念、模式與元件。真希望我能在多年前就能讀到這本書。」 —Robert Sahlin,Mathem資料平台主管 所有的雲端架構師都必須知道如何建置資料平台,以賦與企業能夠快速高效地做出資料驅動的決策,並在整個企業範圍內提供智能化服務。本書將展示如何使用AWS、Azure、Google Cloud以及Snowflake與Databricks這類多重雲端工具,設計、建置與現代化雲端原生資料與機器學習平台。 作者Marco Tranquillin、Valliappa Lakshmanan與Firat Tekiner使用真實世界企業架構來說明,內容涵蓋從雲端匯入到啟動整個資料生命週期。你將學到如何轉換、保全與現代化資料倉儲與資料湖這些熟悉的解決方案,也將能充份利用最新的AI/ML模式取得精準且快速的洞見,提升競爭優勢。 你將學會: *設計現代化且安全的雲端原生或混合資料分析與機器學習平台 *透過將企業資料整合到治理良好、可擴充的與彈性的資料平台,加速資料導向的創新。 *民主化存取企業資料,治理業務團隊提取洞見方式與建置AI/ML的能力。 *讓您的企業利用串流管道即時決策 *建置MLOps平台,移往預測性與指示性分析

封面

商用大數據分析-第二版(ERP學會商用數據應用師認證教材指定用書)

書號:AED005100

👍 中華企業資源規劃學會「商用數據應用師」認證教材指定用書 過去在商用大數據分析上,多著重在演算法的介紹,內容過於側重數理理解,這讓許多商管學生為之卻步。更有甚者,是太著重在程式撰寫上,這也讓沒有程式基礎的學生難以親近應用。 本書要打破這些商管學生的困擾,以顧客的R(銷售時間)、F(銷售頻率)、M(銷售金額)商業資料為主,以循序漸進方式,介紹各類資料探勘的聰明方法(即演算法),再透過免費的Google Colab平台,以Python語言為基礎,用簡易的指令撰寫,協助商管背景人士一步步進行操作,期望商管人士可以在這樣開放、免費的環境下,透過案例說明與實作,輕鬆跨過這道牆,建立起對商用大數據分析的正確基礎觀念與操作。 * 最新第二版特別針對生成式人工智慧(Generative AI)等新興技術進行介紹,讓讀者可以在大數據的框架下,掌握未來技術的發展趨勢。 * 以豐富的插圖與淺顯易懂的解說,輕鬆讀懂大數據演算法的內容。 * 提供商管案例做為資料探勘參考。 * 所有實作資料來自於轉換後的真實商業資料。 * 提供完整程式碼無痛接軌實作。 * 中華企業資源規劃學會「商用數據應用師」認證教材指定用書。

封面

資料工程基礎|規劃和建構強大、穩健的資料系統

書號:A745

🏆🏆🏆 Amazone 400+ 五星好評 🏆🏆🏆 👉 資料領域的必讀書單📚 ,適合IT專業人士和學生,尤其適合希望深入了解資料工程的讀者。 👉 書中提供資料工程的基本和進階概念,對於理解當前和未來的資料工程趨勢和技術非常有幫助。 👉 作者的寫作風格值得讚賞,使用的比喻和舉例能將複雜的概念有效簡化,更易理解。 👉 提供清晰的資料工程生命週期概念,有助提升資料管理和專案管理的能力。 「資料世界發展到現在已經有一段時間。首先從設計師開始,然後是資料庫管理員,接著是首席資訊官,然後是資料架構師。這本書將促使該行業朝著更加成熟和先進的方向發展。對於每一位認真對待自己的專業和職業的人來說,這都是一本必讀之作。」 —Bill Inmon 資料倉儲創建者 「《資料工程基礎》是一本絕佳的入門書籍,涵蓋了資料遷移、處理和管理的相關業務。我要強力推薦給任何想要快速瞭解資料工程或分析方面的人,或者想要填補自己知識漏洞的現有從業人員。」 —Jordan Tigani MotherDuck創始人和首席執行官 / BigQuery創始工程師和共同創始人 過去十年來,資料工程發展迅速,讓許多軟體工程師、資料科學家及分析師渴望全面了解這個領域的全貌。這本實用的書籍將告訴你,如何在資料工程生命週期的框架下,評估並選擇最適合的技術,規劃和建構系統能滿足你的組織與客戶需求的資料系統。 本書作者Joe Reis和Matt Housley將帶您深入瞭解資料工程生命週期,並解說如何把各種雲端技術接合起來,以滿足下游資料消費者的需求。你將瞭解如何應用資料產生、攝取、編排、轉換、儲存和治理等概念,這些概念在任何資料環境中都至關重要,而且與底層技術無關。 本書將助您: ‧掌握資料工程領域的精要與全貌。 ‧使用端到端的最佳實踐框架評估資料工程問題。 ‧正確選擇資料技術、架構和流程,避開誇大的行銷手法。 ‧使用資料工程生命週期來設計和建構強大、穩健的架構。 ‧將資料治理與安全性融入整個資料工程的生命週期。

封面

具成本效益的資料管道

書號:A770

開發雲端資料管道的權衡之計 「Sev Leonard的最佳實踐和策略可以為我的雇主節省數百萬美元。對比一本書的價格和閱讀時間而言,這是相當不錯的投資回報。」 —Bar Shirtcliff 軟體工程師 「這就是我們一直在等待的那本書,它為監控、控制和優化高效能雲端資料系統的成本,提供了清晰、有條不紊的指導。」 —Matthew Housley 首席技術長兼《資料工程基礎》的合著者 起初,雲端服務的成本看起來經濟實惠,但很容易在日後演變為一筆巨額開支。這對於開發資料管道的團隊來說是一個挑戰,特別是當技術和工作負載快速變化,而需要不斷重新設計週期,導致在開發、調試和停機方面產生額外的成本支出時,該如何提供可擴展、高度可用的產品,同時兼顧成本控制? 在這本實用指南中,Sev Leonard提供了適用於雲端環境設計下,一種可擴展資料管道的整體方法,幫助您在雲端運算和儲存、管道開發和測試、以及監控之間進行成本效能的權衡之計。透過專注於整個設計過程,資料工程師、軟體開發人員、架構師和管理人員可以交付具有成本效益的高品質產品。本書可以幫助您: ‧透過具有成本意識的服務和智慧設計策略,降低雲端費用支出 ‧調整運算資源規模,在不犧牲效能的情況下,最大限度減少資源浪費 ‧推動資料管道發展防止效能問題,並透過有效監控來快速調試、除錯 ‧設定開發和測試環境,盡可能減少雲端服務依賴性 ‧建立可測試且可擴展的資料管道程式碼,降低開發成本並加速管道演進 ‧透過驗證和測試來提高資料品質和管道運行

封面

商業大數據的視覺化設計與Power BI實作應用

書號:AED005000

👍 世新大學校長 陳清河 / 國立中央大學副校長 許秉瑜 ~誠摯推薦~ 【中華企業資源規劃學會 視覺化軟體應用師認證教材指定用書】 現在是一個大數據無處不在的年代,無論是企業或個人,建立一個快速解讀資料的能力,顯得相當實用且重要。其中,資料視覺化就是一個備受關注且重視的面向。用視覺化的方式來呈現資料的內容,能夠讓決策者更容易理解,執行者能更輕易的利用圖表與他人進行溝通。因此,資料視覺化的應用已經是許多企業相當看重的大數據分析技術之一。 然而,圖表的類別龐雜,如何選擇適切的圖表來忠實呈現資料,卻是操作者的困擾。因此,本書將資料視覺化的圖形予以整理及分類,藉由各章的說明、介紹、優劣比較與繪製建議,搭配企業個案資料來實際操作,減少讀者天馬行空的想像。 目前坊間資料視覺化的書籍多以軟體功能的介紹與操作為主,本書則是以不同應用類型的視覺化圖表為重點,搭配Power BI進行教學與解說,期待讓讀者在未來的應用上能夠更為得心應手。 最後,本書設計了一個整合的應用,利用企業的資料來進行實戰。透過資料視覺化的相關整合應用,去解讀企業營運時的狀態與樣貌,進而部署儀表板,提供即時決策參考。

封面

資料庫內部原理|深入了解分散式資料系統的運作方式

書號:A656

「為了選擇適合的工具來完成工作,我們必須了解其設計背後的概念和演算法。本書是由業界從業者為初學者撰寫的入門書籍,涵蓋了許多相關主題。」 -Michael Klishin RabbitMQ長期貢獻者 「對於任何從事資料庫技術有關的人來說,這是一本必備的書籍,尤其是在需要做出使用哪些系統的決策時。」 -Nate McCall Apache Cassandra貢獻者及PMC主席 在選擇、使用和維護資料庫時,了解其內部原理是必不可少的。然而,隨著當今有許多分散式資料庫和工具可供選擇,往往很難了解每個資料庫提供的功能和它們之間的差異。在這本實用指南中,Alex Petrov將引導開發人員深入了解現代資料庫和儲存引擎內部的概念。 在整本書中,您將探索從眾多書籍、論文、部落格文章及幾個開源資料庫的原始碼中所獲取的相關資料。您將發現,許多現代資料庫中,最重要的區別在於決定儲存結構和資料分散方式的子系統中。 您將深入探討以下內容: ‧儲存引擎:了解儲存分類和分類法,深入研究基於B樹(B-tree-based)和不可變的日誌(immutable log-structured)結構儲存引擎。 ‧儲存建構塊:了解如何使用輔助資料結構組織資料庫檔案,如頁面快取和緩衝池,來建立高效的儲存系統。 ‧分散式系統:逐步學習節點和進程如何連接並建立複雜的通訊模式。 ‧資料庫叢集:探索現代資料庫常用的一致性模型,以及分散式儲存系統如何實現一致性。

封面

建構機器學習系統實踐指南

書號:ACD023500

可於第一線使用! 運用設計模式的最佳設計、建構與維護方法 滿載機器學習系統實用化所需的設計、開發、維護知識 適合AI工程師、系統工程師 本書旨在提供一個全方位的指南,幫助讀者將機器學習真正應用於實際的商業環境中。 企業的核心是經營事業而不能僅只於研究,所以讓機器學習實用化所需的工程技術與知識,與機器學習的學術研究同樣重要,甚至更加重要。而要讓機器學習快速實用化且變得更加方便,就需要建置各種系統。 本書主要在講述前著《AI開發的機器學習系統設計模式》未能觸及的內容,特別是如何在商業環境中建立機器學習系統,包括定義商業場合的使用情境、建構工作流程與系統,並且強調機器學習系統的實際應用,以及會遇到的問題,詳盡解說如何將機器學習整合到現有的運行系統和工作流程中。 市面上雖然有許多介紹機器學習模型建構與使用方式的書籍,卻很少有針對系統建置的說明。因此,本書的重點在於讓機器學習能夠真正付諸實用,包括課題設定、工作流程設計以及系統建置方法。 本書不僅介紹機器學習模型,更著重於建立應用機器學習所需的前台、後台、基礎架構、管線、BI工具等。 主要內容包括: .定義商業應用場景:介紹不同的商業情境及如何在這些情境中應用機器學習。 .建構工作流程與系統:不僅限於機器學習模型,還包括前台、後台、基礎架構、管線、BI工具及其他相關軟體的建立。 .解決現有書籍的不足:現有書籍多專注於技術和實例,但很少介紹驅動機器學習的系統建構方法。本書彌補這一不足。 .課題設定和系統嵌入:介紹如何設定機器學習要解決的課題,並將其嵌入系統和日常業務活動中。 .實例與應用:書中包含作者自製的智慧型手機App、後台、批次系統及相關資料的實例,並提供實際運作的系統示範。 .前著延伸:本書是《AI開發的機器學習系統設計模式》的延續,涵蓋了前著未涉及的部分,如課題設定和系統嵌入方法。 .綜合技術學習:讀者能通過個案研究學會課題設定、工作流程設計、系統開發及團隊建置等技術。 提供下列需求度較高的機器學習系統範例 .需求預測系統 .違規偵測系統 透過案例,學習機器學習實用化所需的內容 .課題設置 .工作流程設計 .系統開發 .團隊設計

封面

資料科學:困難部分

書號:A772

卓越資料科學的技巧 幫助您在資料科學領域中脫穎而出! 「Daniel再次創作了一部傑作,為資料科學家和業務主管之間搭建了有助創造價值的橋樑。本書就是實現資料科學能獲得商業成功的那本關鍵手冊。」 —Adri Purkayastha BNP Paribas全球AI技術風險主管 「全面涵蓋從經濟學到廣告,甚至是流行病學等多個領域,以及如何實際應用資料科學技術。它開端於大多數書籍結束的地方,深入探討由資料洞察驅動的實際決策過程。是每位資料科學家書架上迫切需要的重要資源。」 —Brett Holleman 自由職業資料科學家 這本實用指南提供了傳統的資料工程和資料科學教育中常被忽略的技術和最佳實務。常見的迷思是,優秀的資料科學家是這個領域中「重大主題」的專家(機器學習和程式設計);但事實上,這些工具僅能帶我們走到一定程度而已。真正能區分頂尖資料科學家與普通資料科學家的,是他們對這些重大主題理解的細微差別,以及他們對商業產生影響的能力。 整體而言,本書內容能使在該領域工作的普通資料科學家和優秀資料科學家產生區別。作者Daniel Vaughan收集、擴展並應用這些技能來創造價值,並培訓來自不同公司和行業的資料科學家。 透過這本書,您將能夠: ‧確保您的資料科學工作流程能創造價值 ‧設計可操作的、及時的、相關的指標 ‧提供引人入勝的敘事,以獲得利益相關者的支持 ‧使用模擬來確保您的機器學習演算法是解決問題的正確工具 ‧識別、修正並預防資料洩漏 ‧透過估算因果效應來了解增量性

封面

Power BI大數據實戰應用-零售x金融

書號:ACD024100

--專業推薦-- 張詠淳 臺北醫學大學大數據與科技管理研究所教授 許毓容 前東森購物大數據協理 陳祥輝 臺北大學統計系業界專業教師兼任助理教授 【主題式分析 + 實戰演練,強化學習效率,全面提升大數據分析能力!】 在當今快速變動且複雜的商業環境中,運用數據提升決策效率至關重要,本書不僅提供了從基礎到進階的Power BI知識,更結合零售/金融產業實戰應用,透過豐富的跨領域實例,讓讀者能夠真正運用數據結合實務情境,達到做中學及接地氣的加成綜效。 精彩重點: .零售x金融產業實戰案例介紹Power BI運用,涵蓋Power BI 三大模組(Power Query、Power Pivot、Power View) .數據工程Power Query – 線上資料蒐集、資料清理、資料合併,建立半自動化數據工程作業。 .資料建模Power Pivot – 使用DAX函數新增資料行、管理量值、瀏覽資料關聯模型。 .資料視覺化Power View – 建置數據儀表板的數據指標架構設計、分析問題的圖表繪製設計建議、產業數據分析經驗。 .豐富的實戰演練,從零售業與金融業數據案例的資料清理,再到運用DAX函數創建數據分析指標,設計各項主題實戰分析儀表板,逐步引導讀者實際操作、獲取實務經驗,確保學習效果。 內容與範例均貼近實務情境,讓讀者更容易理解並結合所學知識。本書不僅適合Power BI使用者,更是從事大數據分析、商業分析或營運分析人員的學習寶藏。

封面

機器學習的公式推導和程式實作

書號:ACD023000

進行機器學習的開發時,精通相關數學理論是關鍵的基礎。本書基於對所有機器學習演算法的系統分類,詳細介紹了監督學習單模型、監督學習集成模型、無監督學習模型、概率模型等四大類共26個經典演算法,並進行詳細的公式推導和程式碼實現。旨在協助讀者充分了解演算法細節、實現方法和內在邏輯。 本書適合數理基礎扎實的初學者,也適合深入學習的進階者閱讀,同時可作為機器學習領域的參考書籍。

封面

Power BI商業智慧分析(第二版)|數據建模、資料分析、安全分享、平台管理與監控

書號:ACD024000

業界頂尖顧問教您如何用Power BI分析資料! 商業智慧(Business Intelligence BI)一直都是顯學,因為企業希望全體做任何決策時,能即時取得有效的輔助資訊,以因應快速地變遷與複雜的商業形勢。而精準的分析能夠改善團隊乃至於企業的決策品質與效率,或更了解客戶的特性,提供更貼心的服務。 本書匯集了業界的實戰經驗與技巧,讓讀者了解如何透過Power BI釋放數據的力量。 .適合使用者從入門到精通Power BI .協助企業IT建構以Power BI為基礎的資料分析平台 .從整理資料開始,一步步教您如何建立豐富的分析報告 .深入說明整理異質型資料來源的Mashup引擎與M語言 .廣泛說明表格式模型的運作原理與效能調校 .以實例說明如何利用DAX語言完成日常所需的分析 .安裝、管理與監控企業內Power BI報表伺服器 .善用雲端Power BI服務協同分析 .了解與使用微軟全新的Fabric平台,統整資料智慧 .透過Azure DevOps和Power BI服務工作區控管與發布報表版本 原廠推薦 「本書匯集了作者豐富的專業知識和實踐經驗,涵蓋了基本的數據建模到複雜的商業智能分析,您將會學習到如何利用Power BI發掘數據背後的故事,再將這些故事轉化為策略和行動!」 ---宋明遠 台灣微軟雲端解決方案副總經理---

封面

MySQL資料庫開發的樂趣

書號:ACD023600

18堂資料庫開發基礎入門與專題實作課程 《MySQL資料庫開發的樂趣》以快速的學習步調和精簡的學習課程,帶領讀者進入關聯式資料庫開發的世界。書中充滿實務範例和專家建議,協助讀者快速上手。 本書會帶讀者學習SQL語言的基礎技能、如何建立資料庫、打造SQL查詢來取出資料,以及運用事件、程序和函式;了解如何為資料表加入條件約束,強制規定資料表能接受的資料,以及利用索引加速資料檢索,甚至還會探索如何從PHP、Python和Java來呼叫MySQL。 最後會介紹三個專題:說明如何從無到有建立天氣資料庫、利用觸發器防止選舉資料庫發生錯誤,以及使用檢視表來保護薪資資料庫內的敏感資料。 本書學習重點: ‧針對特定資訊查詢資料庫中的資料表、排序查詢結果、為SQL程式碼加入註解以及處理空值。 ‧為了保存字串、整數和日期等資料,資料表需要定義資料欄,並且判斷該使用哪種資料型態。 ‧針對資料庫中的多個資料表進行合併查詢,以及如何運用暫存資料表、通用資料表運算式、衍生資料表和子查詢。 ‧新增、修改和移除資料表中的資料、根據特定查詢建立檢視表、撰寫可重複使用的預存常用程序以及自動執行已排程的事件。 《MySQL資料庫開發的樂趣》為資料庫開發人員提供完美的快速入門資源,裝備一些需要的工具,協助開發人員以MySQL為基礎,建立和管理快速、強大且具有安全性的資料儲存系統。 線上資源:讀者只要前往本書提供的連結https://nostarch.com/mysql-crash-course,即可下載本書的程式腳本(用於建立書中有用到的MySQL範例資料庫和資料表)、程式碼和練習題的答案。

封面

精通機器學習|使用Scikit-Learn, Keras與TensorFlow 第三版

書號:A712

建立智慧型系統的概念、工具與技術 「這是一本出色的機器學習資源,包含淺顯易懂的解說,以及豐富的實用技巧。」 —François Chollet Keras作者,《Deep Learning with Python》作者 「本書是運用神經網路來解決問題的絕佳入門資源,涵蓋理論及實踐。推薦給想學習實用機器學習技術的人。」 —Pete Warden TensorFlow行動主管 深度學習在經歷了一系列的突破之後,已經推動了整個機器學習領域的發展。如今,即使是對於這項技術非常陌生的程式設計師,也能夠使用簡單、高效率的工具,寫出能從資料中學習的程式。這本暢銷書使用具體的例子、最少的理論,以及具備生產水準的Python框架(Scikit-Learn、Keras和TensorFlow)來協助你直接瞭解智慧系統的建構概念與工具。 在這本第三版中,作者Aurélien Géron將探索一系列的技術,從簡單的線性回歸開始,逐步發展到深度神經網路。本書包含許多範例程式和習題來幫助活用所學,只要具備一些程式設計經驗即可入門。 ‧使用Scikit-Learn自始至終完成機器學習專案 ‧探索多種模型,包括支援向量機、決策樹、隨機森林,和集成方法 ‧運用無監督學習技術,例如降維、聚類法和異常檢測 ‧深入探討神經網路架構,包括摺積神經網路、遞迴網路、生成對抗網路、自動編碼器、擴散模型、轉換器 ‧使用TensorFlow和Keras建構和訓練神經網路,以進行計算機視覺、自然語言處理、生成模型和深度強化學習

封面

資料治理技術手冊

書號:A746

實現資料可信度的人員、流程和工具 「現今組織產生的資料量和種類比以往任何時候都來得多,企業需要更加了解手中的資料並為未來趨勢做好準備,他們必須採行現代資料治理方式—透過事先設計而不是事後才想到。」 —Jim Cushman, Collibra產品長 當您將資料移動到雲端時,對於資料該如何治理,您需要考慮全面的管理方法,以及定義明確且利益相關者皆有相同共識的策略,以確保您的組織滿足合規性要求。資料治理結合了人員、流程和技術協同工作的方式,以確保資料值得信賴並且可以有效使用。本實務指南向您展示如何在整個組織中實施和擴展資料治理。 首席資訊長、資料長和資訊安全長及其團隊將學習戰略和工具,以支持資料民主化並釋放其價值,同時執行安全、隱私和其他治理標準。通過良好的資料治理,您可以激發客戶信任,使您的組織能夠確定業務效率,產生更具競爭力的產品,並改善客戶體驗。這本書會教你怎樣做。 您會學到: ‧針對人員、流程和工具的資料治理策略 ‧基於雲端服務的資料治理方法的優勢和挑戰 ‧從資料擷取到資料準備和使用,資料治理是如何進行的 ‧如何對資料質量做持續性改進 ‧治理串流資料的挑戰和技術 ‧針對身份驗證、安全、備份和監控的資料保護 ‧如何在您的組織中建立資料文化

封面

Python資料科學學習手冊 第二版

書號:A727

處理大量資料的基本工具 「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。 對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。 藉由本書,你將可以學習到: ‧IPython和Jupyter:提供資料科學家使用的Python計算環境 ‧NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys ‧Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 ‧Matplotlib:在Python中進行彈性範圍的資料視覺化功能 ‧Scikit-Learn:提供機器學習演算法以及簡潔的Python實作

封面

文科生也可以輕鬆學會Web Scraper網路爬蟲與Power Automate X Excel大數據分析

書號:ACD023900

不用動手寫程式,讓Web Scraper爬蟲 X Power Automate自動化工具幫你搞定! • 活用ChatGPT學習網路爬蟲、大數據分析和辦公室自動化 • ChatGPT學習SQL語法,建立高效率Excel資料處理術 ⭐️ Web Scraper是第一名Chrome擴充功能的爬蟲工具,不用撰寫程式碼,就可以建立CSS選擇器的網站爬取地圖從網站擷取資料,本書不只教你利用內建視覺化工具輕鬆爬取Web網站,更能夠使用ChatGPT學習HTML標籤+CSS選擇器,並了解各種網站巡覽結構。 ⭐️ Power Automate Desktop自動化工具,可以建立流程來執行一系列動作,輕鬆打造Windows應用程式和Excel自動化,來提高辦公室的工作效率,不只如此,再搭配書中使用ChatGPT學習SQL語法後,我們更可以整合Power Automate Desktop + SQL建立高效率的Excel資料處理。

封面

資料視覺化|使用Python與JavaScript 第二版

書號:A726

擷取、清理、分析與轉換資料 「Kyran的書包含了大量資訊,從D3.js細節說明,到如何建構出由客製化互動式儀表板所使用的、且由資料庫所支持的API。可以肯定地說,您將從這本書中學到很多東西!」 —Peter Cook, 《D3 Start to Finish》作者 如何將原始、未經處理的資料轉化為動態的互動式web視覺化?在這本實用的書中,作者Kyran Dale向資料科學家、分析師以及Python、JavaScript開發人員,展示如何為工作建立理想的工具鏈。藉由提供引人入勝的範例以及分享得之不易的實務經驗,本書將引導您善用最佳的Python和JavaScript程式庫。 Python為爬取、清理和處理資料提供強大、成熟的程式庫。在web視覺化程式設計方面,JavaScript是最好的語言。這兩種語言相得益彰,可以幫助您建立現代web視覺化工具鏈。 您將學習如何: ‧使用爬取或web API(Requests、Scrapy、Beautiful Soup)獲取資料 ‧在NumPy生態系統(帶有pandas、Matplotlib和Seaborn的Jupyter notebook)中使用Python資料處理程式庫清理和處理資料 ‧使用靜態檔案或輕量級Python伺服器(Flask RESTful API)將資料交付到瀏覽器 ‧掌握足夠的web開發技能(HTML、CSS、JavaScript)將資料視覺化 ‧使用挖掘和精煉資料建立web圖表和視覺化(Plotly、D3)

封面

用Python快速上手資料分析與機器學習 第二版

書號:ACD023400

廣受讀者好評、第二版登場! 紮實地學會資料分析工程師所需要的基本技能 書中會對資料分析工程師所需要的基本技巧進行詳盡解說。 ‧取得資料、處理資料 ‧資料視覺處理 ‧編寫程式碼 ‧基礎數學知識 ‧機器學習的流程與執行方法 第2版的重點 ‧支援Python 3.10版本 ‧用更深入淺出的方式進行講解 在書中可以學到 ‧Python基本語法 ‧講解資料格式 ‧資料的預處理技巧 ‧資料視覺處理技巧 ‧運用現成的演算法來執行機器學習 適合對象 想成為資料分析工程師的讀者

封面

Google Analytics學習手冊

書號:A725

創造商業影響力與洞察先機 「藉助Google Analytics的學習過程,熟悉這個數位行銷道具箱裡的每項工具,不僅能了解手上的資料、活化資料,還能創造出自己的競爭優勢,推動價值與成長。」 —Melinda Schiera, 策略分析師 在數位行銷分析領域裡,當前最新的資料模型非Google Analytics 4莫屬,因為GA4不只回報已經發生的事,新增的雲端整合功能還可以活用更多的資料,橫跨所有資料串流,串接線上與離線資料,提供點對點的行銷資料。這本實用手冊還會示範GA4如何支援這些新增的雲端整合功能,幫助讀者做好準備,迎向數位行銷的未來。 本書作者Mark Edmondson是Google Analytics和Google Cloud的開發專家,他針對GA4及其雲端整合應用,提供簡要但全面的入門介紹。資料、商業與行銷分析人員可以從本書學到GA4新的分析模式裡幾個強大的主要面向,主題包含資料架構與策略,資料擷取、儲存和建模,探索幾個常見的資料活用使用案例,指引分析人員實作案例時需要的步驟。 讀者將從本書學到: ‧Google雲端平台如何結合GA4 ‧GA4能與哪些使用案例結合 ‧建立GA4整合應用時需要哪些技術和資源 ‧啟用使用案例時,GA4必須先擷取多少資料 ‧設計資料流的程序,從策略到資料儲存、建模與活化 ‧如何調整使用案例,以符合自身的業務需求

封面

Python資料分析 第三版

書號:A709

使用pandas、NumPy和Jupyter進行資料整理 「Wes更新了這本新版本的內容,確保它是學習Python和pandas資料分析知識的首選資源。再多的言語都無法形容我是多麼推薦這本書。」 —Paul Barry 講師及O’Reilly《深入淺出Python》作者 這本權威的手冊將教你如何在Python中操作、處理、清理、整理資料組。第三版配合Python 3.10和pandas 1.4進行更新,用豐富的案例研究教你如何有效地解決廣泛的資料分析問題。在過程中,你將學會最新版的pandas、NumPy和Jupyter。 作者Wes McKinney是Python pandas專案的創始人,在這本書中,以實用和現代化的方式介紹Python資料科學工具組,本書非常適合剛接觸Python的分析師,以及剛接觸資料科學和科學計算的Python程式設計師。本書在GitHub提供資料檔案與相關素材。 ‧使用IPython shell和Jupyter Notebook進行探索性計算 ‧學習NumPy基礎和進階功能 ‧認識pandas程式庫的資料分析工具 ‧使用靈活的工具進行載入、清理、轉換、合併與重塑資料 ‧用matplotlib製作資訊豐富的視覺化圖表 ‧運用pandas的groupBy工具對資料進行切割與彙總 ‧分析與處理正規和非正規的時間序列資料 ‧透過詳盡的範例學習如何解決真正的資料分析問題

封面

ColorWise|用顏色說故事

書號:A733

「在全球各地的企業中,顏色的不當運用屢見不鮮,每天都在影響資料的閱讀和理解。正確使用顏色能將資料敘事和儀表板設計推向新的高度。Kate Strachnyi在本書中整合了你需要掌握的色彩運用知識和觀念,有助於提升資料視覺化的成果。」 — Bernard Marr,暢銷書《Data Strategy》作者 在當今商業領域,資料被譽為最具威力的工具,因此,有效地呈現資料故事變得至關重要。然而,在資料視覺化過程中,「顏色」這一關鍵資訊傳遞要素卻經常被忽略。在本書中,DATAcated創辦人Kate Strachnyi為讀者呈現了一份關於圖表、表格和資訊圖表中顏色運用的終極指南。 本書內容實用且具啟發性,非常適合資料分析師、商業分析師、資料科學家以及從事資訊圖表和資料視覺化設計的專業人士。書中深入探討了顏色運用的技巧和訣竅,包括色彩背後的理論、各種色彩搭配的效果與成因。此外,本書還涵蓋了顏色的心理學、歷史和文化等多方面知識,更是學習如何運用顏色提升資料敘事技巧和儀表板設計的絕佳教材。 本書會帶給你: ‧深入了解色彩學在資料視覺化和敘事中所扮演的角色 ‧掌握各種有助於改善資料視覺化效果的顏色運用技巧 ‧明白顏色如何影響觀眾對資料視覺化內容的理解 ‧學會巧妙地搭配顏色,並有效引導觀者的閱讀方式 ‧掌握使色覺缺陷者也能輕鬆閱讀的顏色應用技巧 ‧學會如何將本書的原則應用於專案中 Kate Strachnyi是 DATAcated公司的創辦人,為數據公司提供品牌加值服務。她曾主持過眾多與資料敘事、儀表板設計技巧以及視覺最佳實務範例等相關的課程和演講。亦曾主辦DATAcated研討會,吸引了數千名資料專業人士參加,並主持《DATAcated On Air》podcast頻道。Kate分別在2018年和2019年被評選為LinkedIn資料科學與分析領域的頂尖聲音(Top Voices)之一。

封面

Deep Learning 4|用Python進行強化學習的開發實作

書號:A720

本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。 從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。

封面

SQL的五十道練習:初學者友善的資料庫入門

書號:AED004200

*超值提供Hahow好學校「SQL的五十道練習」課程11個單元免費試看,以及專屬的課程折扣碼! *採用SQLite,搭配生活化的資料庫內容與題目設計,迅速掌握SQL與資料庫基本知識。 我們可以將 SQL 在資料分析工具中定位為比較基礎、不是那麼絢麗的一個角色,它樸實地將資料分析專案與資料存儲之間的橋樑搭起來,甚至在資料庫管理員與資料工程師的手中,SQL 更是建構資料存儲的主角。 想要有效確實地將 SQL 學起來(適用於任何技能、包含且不限於程式語言),需要在每個知識點運用 LPAA 循環(Learn、Practice、Apply、Assess),首先透過本書的文字敘述理解觀念接著在自己電腦中所建立的學習環境跟著本書的範例操作,觀察是否得到相似的查詢結果,然後是寫作練習題進而驗證所學。 「SQL 的五十道練習」核心精神,採用了 EBL (Exercise Based Learning) 的學習理念,可以確保讀者在每個章節都會走一遍 LPAA 循環,五十九道練習都是明確給定預期輸入和預期輸出的題目設計,直觀而有效。 本書採用 SQLite 關聯式資料庫管理系統,能夠以檔案的形式提供給讀者離線使用,對初學者來說其精簡的架構與完整的功能性,是最合適也最友善的選擇。 本書是初學者友善的,只需要有基本的電腦操作能力與高中程度以上的英文就能入門 SQL,不需要任何程式或者資料庫的背景知識基礎,所有入門知識都會慢慢在書本內容講授。