Интерполировать между каждой строкой data.frame
Я хочу быстро выполнить повторную выборку 9X_rstats и интерполяцию между каждой строкой data.frame
. Я 9X_interpolation не возражаю против работы с data.table
или другими 9X_interpolation структурами данных, если это необходимо. Вот 9X_r-language воспроизводимый пример:
df <- data.frame(x = c(0, 2, 10),
y = c(10, 12, 0))
Желаемый результат: функция 9X_base-r f(df, n)
, где n
— количество значений интерполяции, которые 9X_interpolate приведут к:
df_int <- f(df, 1)
# That would produce :
# df_int <- data.frame(x = c(0, 1, 2, 6, 10),
# y = c(10, 11, 12, 6, 0))
df_int <- f(df, 3)
# That would produce :
# df_int <- data.frame(x = c(0, 0.5, 1, 1.5, 2, 4, 6, 8, 10),
# y = c(10, 10.5, 11, 11.5, 12, 9, 6, 3, 0))
Некоторые решения были предложены 9X_r-language с использованием approx
, но в моем случае это 9X_r не работает.
Ответ #1
Ответ на вопрос: Интерполировать между каждой строкой data.frame
Без учета скорости
interpolate_vector <- function(x, n) {
Reduce(function(x, tail_x) {
c(head(x, -1), seq(tail(x, 1), tail_x[1], length.out = n + 2))
}, init = x[1], x = tail(x, -1))
}
f <- function(df, n) {
as.data.frame(lapply(df, interpolate_vector, n))
}
f(df, 1)
x y
1 0 10
2 1 11
3 2 12
4 6 6
5 10 0
f(df, 3)
x y
1 0.0 10.0
2 0.5 10.5
3 1.0 11.0
4 1.5 11.5
5 2.0 12.0
6 4.0 9.0
7 6.0 6.0
8 8.0 3.0
9 10.0 0.0
Без Reduce
и растущих векторов:
interpolate_vector_2 <- function(x, n) {
res <- numeric(length = (length(x)-1) * (n+1) + 1)
for (i in head(seq_along(x), -1)) {
res[(i + (i-1)*n) : (i + i*n + 1)] <-
seq(x[i], x[i+1], length.out = n+2)
}
res
}
f_2 <- function(df, n) {
as.data.frame(lapply(df, interpolate_vector_2, n))
}
Шаблон 9X_interpolate эталона (включая ответы @Maël):
res <- bench::press(
rows = c(1e2, 1e3),
n = c(1, 3, 10),
{
df <- data.frame(
x = runif(rows),
y = runif(rows)
)
bench::mark(
zoo = f_3(df, n),
loop = f_2(df, n),
reduce = f(df, n),
approx = f_4(df, n)
)
}
)
Ответ #2
Ответ на вопрос: Интерполировать между каждой строкой data.frame
Другая возможность с zoo::na.approx
. Идея состоит в том, чтобы 9X_interpolation создать вектор с n
NA между элементами векторов, а 9X_base-r затем использовать na.approx
. Это решение предположительно 9X_r-language является самым быстрым (см. benchmark).
library(zoo)
interp <- function(v, n){
na_vec <- c(sapply(v, \(x) c(x, rep(NA, n))))[1:((length(v) - 1) * (n + 1) + 1)]
zoo::na.approx(na_vec)
}
f <- function(df, n) as.data.frame(lapply(df, interp, n))
примеры
f(df, 1)
# x y
# 1 0 10
# 2 1 11
# 3 2 12
# 4 6 6
# 5 10 0
f(df, 3)
# x y
# 1 0.0 10.0
# 2 0.5 10.5
# 3 1.0 11.0
# 4 1.5 11.5
# 5 2.0 12.0
# 6 4.0 9.0
# 7 6.0 6.0
# 8 8.0 3.0
# 9 10.0 0.0
Ответ #3
Ответ на вопрос: Интерполировать между каждой строкой data.frame
Использование approx
:
interp <- function(x, n){
v = c()
for(i in seq(length(x) - 1)) {
tmp = approx(c(x[i], x[i + 1]), n = 2 + n)$y
v = c(v, tmp)
}
v[!duplicated(v)]
}
f <- function(df, n) as.data.frame(lapply(df, interp, n))
примеры
f(df, 1)
# x y
# 1 0 10
# 2 1 11
# 3 2 12
# 4 6 6
# 5 10 0
f(df, 3)
# x y
# 1 0.0 10.0
# 2 0.5 10.5
# 3 1.0 11.0
# 4 1.5 11.5
# 5 2.0 12.0
# 6 4.0 9.0
# 7 6.0 6.0
# 8 8.0 3.0
# 9 10.0 0.0
9X_interpolation
-
15
-
9
-
6
-
6
-
3
-
4
-
5
-
5
-
3
-
4
-
3
-
1
-
3
-
6
-
1
-
2
-
10
-
3
-
2
-
3
-
6
-
7
-
4
-
3
-
2
-
1
-
2
-
3
-
4
-
2
-
3
-
1
-
1
-
2
-
2
-
6
-
1
-
1
-
3
-
4
-
1
-
1
-
4
-
2
-
4
-
1
-
3
-
2
-
1
-
1