< >
從門外漢晉身高手“這本書對想運用Python進行資料分析的新手而言,是很實用的學習資源。這本書的教學風格與練習,可協助初學者體驗Python語言、程式寫作環境,以及一些在這個環境中最重要的套件。” -Wes McKinney, pandas程式庫的創造者如果你是7.5億Excel使用者其中之一,但想要更進一步運用資料,例如對上百個檔案重複執行類似的分析,或一次結合許多檔案的資料進行分析;這本實用的指南,將會教導你這位具備遠大理想,但沒有程式寫作經驗的人,使用Python來自動處理與分析各種格式的資料,並且擴展程式的功能。你不需要具備任何程式設計經驗,當你學習到作者傳授的Python基礎之後,你將有能力編寫簡單的腳本來處理試算表與資料庫內的資料。你也會學到如何使用一些Python模組來解析檔案、分組資料,以及產生統計結果。‧學習基本語法,建立並執行自己的Python腳本‧使用Python的csv模組讀取與解析CSV檔案‧使用xird模組讀取多個Excel工作表與活頁簿‧以MySQL或使用mysqlclient模組執行資料庫作業‧建立Python應用程式尋找特定的記錄、分組資料及解析文字檔案‧使用matplotlib、pnadas、ggplot與seaborn建立統計圖表‧產生摘要統計,並估算迴歸與分類模型‧安排腳本的執行時間,在Windows與Mac環境下自動執行它們
Clinton Brownley 是任職於Facebook的資料科學專家,負責各式各樣的資料管線、統計模型建立及資料視覺化專案,提供資訊並協助大型的資料基礎設施決策。他也是Section on Practice of the Institute for Operations Research and the Management Sciences的理事會成員。
前言這本書的對象是經常需要處理試算表資料,但沒有寫過半行程式的人。第1章會教你設定Python環境,讓電腦可以檢視資料,並對它們採取一些簡單的動作。很快地,你就會學到如何用試算表(CSV檔)與資料庫內的資料來做事。一開始,你會覺得這像在走回頭路,特別是當你很熟悉Excel時。之前你只需要選擇欄位的資料,並將它們貼在別的地方就可以了,但現在得煞費苦心地告知Python如何以迴圈來執行某個欄位的每一個資料格,這會讓你覺得進度緩慢,感到挫折(特別是當你必須再三回去尋找錯字時)。但是熟練之後,你就會看到Python的價值,特別是在它為你自動執行需要不斷重複進行的工作時。這本書的寫法,是讓你從頭到尾跟著實作,讓你有信心可以寫出可動作,而且可以按照期望來做事的程式。一開始,你可以自行輸入程式碼,這種做法,可讓你習慣使用tab,以及加上結束的括號與引號,不過,你可以從網路取得所有的程式碼(https://github.com/cbrownley/foundations-for-analytics-with-python),讀完這本書之後,你可以前往那些連結,複製與貼上裡面的程式碼來完成你自己的工作。這是沒問題的!知道何時該剪下與貼上程式,是成為高效率程式員的要素。在閱讀這本書的同時,操作各個範例,可讓你知道範例程式碼的原理。祝你在成為程式員的旅程中一帆風順!
第1章 Python 基礎第2章 以逗號分隔值(CSV)檔案第3章 Excel 檔第4章 資料庫第5章 應用第6章 圖表第7章 描述性統計與模型建立第8章 排程並自動執行腳本第9章 你的下一步附錄A 下載說明附錄B 練習題解答參考書目索引
Data Science from Scratch中文版|用Python學資料科學 網站擷取|使用Python Think Python|學習程式設計的思考概念 第二版
購買紙本書