< >
資料匯入、整理、變換、視覺化與模型建立「Hadley Wickham是資料科學領域的傳奇,發明了一種從來沒人想過的全新方式來進行資料分析。他與Garrett Grolemund合著的這本新書詳細介紹了這種創新做法,它將會成為當代資料分析師的聖經。」─Roger D. Peng, 生物統計學教授Johns Hopkins大學Bloomberg公共衛生學院學習如何使用R將原始資料轉化為洞見、知識和理解。本書為你介紹R、RStudio,還有tidyverse這個R套件集合,你將學會運用其中相輔相成的套件,使資料科學變得快速,流暢和有趣。《R 資料科學》是為了讓你能夠盡快開始實作資料科學而設計,適合以前沒有程式設計經驗的讀者。作者Hadley Wickham和Garrett Grolemund將引導你走過資料的匯入、整理、探索,以及建立模型和傳達結果這些步驟。你將全面理解資料科學的運作週期,並獲得管理其中細節所需的基本工具。你會學到如何■ Wrangle:將你的資料集轉為方便分析的形式■ Program:使用強大的R工具以更清楚且輕鬆的方式解決資料問題■ Explore:審查你的資料,產生假設,並快速地測試它們■ Model:提供低維摘要,捕捉你資料集所含的真實「訊號」■ Communicate:使用R Markdown來整合說明文字、程式碼以及結果
Hadley Wickham 是RStudio的首席科學家,也是R Foundation的成員。他建置使資料科學更容易、更快速、更有趣的工具(用於計算和輔助認知的都有)。更多資訊在他的網站 http://hadley.nz。Garrett Grolemund 是RStudio的統計學家、教學人員以及大師級講師。他是《Hands-On Programming with R》(O’Reilly)的作者。Garrett的許多教學影片都可在oreilly.com/safari取得。
前言第一部 探索第一章 使用ggplot2 的資料視覺化第二章 工作流程:基本知識第三章 使用dplyr 進行資料變換第四章 工作流程:指令稿第五章 探索式資料分析第六章 工作流程:專案第二部 整頓(Wrangle)第七章 Tibbles第八章 使用readr 匯入資料第九章 使用tidyr 整理資料第十章 使用dplyr 的關聯式資料第十一章 使用stringr 處理字串第十二章 使用forcats 的因子第十三章 使用lubridate 處理日期與時間第三部 程式(Program)第十四章 使用magrittr 的管線作業第十五章 函式第十六章 向量第十七章 使用purrr 的迭代作業第四部 模型第十八章 使用modelr 的模型基礎第十九章 模型建置第二十章 使用purrr 和broom 的許多模型第五部 溝通第二十一章 R Markdown第二十二章 使用ggplot2 建立溝通用的圖表第二十三章 R Markdown 格式第二十四章 R Markdown 工作流程索引
Mapping Experiences 看得見的經驗|創造價值從經驗圖像化開始 R 錦囊妙計 資料視覺化|使用Python與JavaScript
購買紙本書