{purrr}
は個人的に、かなり利用頻度の高いパッケージのひとつで、apply 系の関数は使い方を忘れてしまうくらい map 系の関数をよく使っている。それで {purrr}
は使いこなしているつもりになっていたが Adverbs という、これまで全く使ってこなかったカテゴリーの関数群の存在を知って、これがなかなかおもしろそうだったので、紹介してみたい。
といっても、一通りマニュアルにある例を流してみた、という程度のため、何か間違った記載があるかもしれない。今後、さらに要点をつかめてきたら再度更新したい。
Adverbs とは?
そもそも、Adverbs とは、「関数を引数にとり、関数を返す」関数のこと。元の関数にひと味くわえる・修飾するという意味で、Adverbs (副詞) という言葉が、使われているようだ。 (関数型言語の世界では、よく使われる用語なのだろうか、、よくわからない。)
関数をラップして、より便利に利用できる関数を定義する、というのはよくあることだが、頻出するケースを {purrr}
側で用意してくれている、と考えればよいと思う。
Adverbs 一覧
最新の {purrr}
0.3.4
に収録されている関数を一覧にまとめると、このようになる。 safely()
や insistently()
辺りを使うと、普段書いているような、エラー処理を含む関数をシンプルに書くことができて良さそうだ. lift()
系の関数や compose()
などは、ぱっと見で利用シーンが浮かばないが、この辺りを使いこなすと 関数型を使いこなしていて、なんかすごそう な感じがする。
関数名 |
返ってくる関数 |
safely() |
エラー時に止まらずに list(result, error) を返す関数 |
possibly() |
エラー時に止まらずに、設定したデフォルト値を返す関数 |
auto_browse() |
エラー時に自動的に browse() する関数 |
quietly() |
メッセージを出力せずに、 list(result, output, warnings, messages) を返す関数 |
insistently() |
エラー時に指定した条件(待ち時間・試行回数)でリトライする関数 |
slowly() |
連続実行の際に、指定時間待ってから試行する関数 |
lift() , lift_**() |
引数の形式が変更された関数 (例: vector -> list など) |
compose() |
複数の関数を結合した関数 |
partial() |
一部の引数を固定した関数 |
negate() |
否定形の関数 |
個別の紹介
safely()
- エラーを発生し得る関数をラップして
list(result, error)
を返す
- エラーがなければ
error = NULL
, エラーがあれば result = NULL
- 条件 (データやパラメタ) によって、エラーを吐くアルゴリズムなどを安全に処理できる
1
2
3
4
5
6
7
|
library(purrr)
f <- function() {
stop("Error!!", call. = FALSE)
}
safe_f <- safely(f)
safe_f()
|
1
2
3
4
5
|
$result
NULL
$error
<simpleError: Error!!>
|
zeallot::`%<-%`
(Python のアンパックに相当) を利用するとより簡潔に以降の処理を書くことができる。
1
2
3
4
|
library(zeallot)
c(res, err) %<-% safe_f()
res
err
|
1
2
3
|
NULL
<simpleError: Error!!>
|
possibly()
- エラー時には、エラーではなく、事前に設定したデフォルト値 (
otherwise
引数) を返す
1
2
|
possibly_f <- possibly(f, otherwise = "default")
possibly_f()
|
auto_browse()
- エラー時に自動的に
browse()
を起動してデバッグを支援してくれる
1
2
|
auto_browse_f <- auto_browse(f)
auto_browse_f()
|
quietly()
- メッセージを出力せずに
list(result, output, warnings, messages)
で返す
output
が cat()
や print()
からの出力
- スクリプト実行で余計なメッセージを抑制したい場合に便利
1
2
3
4
5
6
7
8
9
|
verbose_f <- function() {
cat("output!\n")
message("messages!")
warning("warnings!")
"result!"
}
quiet_f <- quietly(verbose_f)
quiet_f()
|
1
2
3
4
5
6
7
8
9
10
11
|
$result
[1] "result!"
$output
[1] "output!"
$warnings
[1] "warnings!"
$messages
[1] "messages!\n"
|
insistently()
- エラーが発生した場合、成功するまでリトライしてくれる
1
2
3
4
5
6
7
8
|
risky_runif <- function(lo = 0, hi = 1) {
y <- runif(1, lo, hi)
if (y < 0.5) stop(y, " is too small")
y
}
rate <- rate_backoff(pause_base = 0.1, max_times = 10)
insist_runif <- insistently(risky_runif, rate = rate, quiet = FALSE)
insist_runif()
|
1
2
3
4
5
6
7
|
Error: 0.402555017499253 is too small
Retrying in 1 seconds.
Error: 0.0129680023528636 is too small
Retrying in 1 seconds.
Error: 0.285843262448907 is too small
Retrying in 1 seconds.
[1] 0.5532546
|
slowly()
1
2
3
|
rate <- rate_delay(0.1)
slow_runif <- slowly(~ runif(1), rate = rate, quiet = FALSE)
map_dbl(1:5, slow_runif)
|
1
2
3
4
5
|
Retrying in 0.1 seconds.
Retrying in 0.1 seconds.
Retrying in 0.1 seconds.
Retrying in 0.1 seconds.
[1] 0.5201321 0.0438438 0.3846940 0.3723179 0.9737134
|
lift()
, lift_**()
- 引数の形式が変換された関数を返す
lift_**()
の形式の亜種が 6 つ
vector
から list
への変換であれば list_vl()
list
から ...
への変換であれば list_ld().
たとえば mean()
は vector
の引数 x
を受け取るので sum()
のように ...
を受け取ると勘違いすると予期せぬ結果になる。
1
2
|
# mean(x, ...)
mean(1, 2, 3)
|
mean()
を ...
を受けるバージョンに変更する場合は lift_vd()
を使えば良い。
1
2
|
lifted_mean <- lift_vd(mean)
lifted_mean(1, 2, 3)
|
compose()
- 複数の関数を結合した関数を作成する。
- デフォルトでは、左から右に結果を受け渡していく。
- パイプで複数の処理を繋げていくような処理をたくさん書いていたら、これにまとめるとスッキリするかもしれない。
1
2
|
add1 <- function(x) x + 1
compose(add1, add1)(8)
|
partial()
- 一部の引数を固定した関数を返す
- ラッパー関数を作成する動機としては、一番シンプルでよくありそう。
1
2
|
my_mean <- partial(mean, na.rm = TRUE)
my_mean(c(1, NA_real_, 2, 3))
|
negate()
- Predicate (真偽を返す関数) の否定形を返す関数
1
2
|
is.not.null <- negate(is.null)
is.not.null(NULL)
|
参考