week_3


1 How do we preprocess the data faster?

1.1 dplyr with dataframe

  • dplyr is a powerful R-package to transform and summarize tabular data with rows and columns.

  • 幫助在前處理數據時常用的功能(ex分組、排序、篩選等),變成簡單好用的函式。

  1. 安裝與使用套件

    1. install.packages("dplyr")

    2. library(dplyr)

  2. 官方文件

    1. dplyr overview
    2. Package ‘dplyr’ pdf(v0.7.4, 2017.09)
  3. 學習資源

    1. dplyr tutorial
    2. DataScienceRBook探索式資料分析

    3. dplyr cheat sheet


1.2 關於apply家族

一個比自己用for迴圈對數據集進行循環更好的選擇。

  • 包括apply, lapply, sapply, vapply, mapply, tapply, rapply, eappply。

  • 相信我。不使用apply家族,你會後悔。

  • 而且很傻。

results matching ""

    No results matching ""