\t
, Tab-Separated Values).xls
, .xlsx
{
"first_name": "John",
"last_name": "Smith",
"is_alive": true,
"age": 27,
"address": {
"street_address": "21 2nd Street",
"city": "New York",
"state": "NY",
"postal_code": "10021-3100"
},
"phone_numbers": [
{
"type": "home",
"number": "212 555-1234"
},
{
"type": "office",
"number": "646 555-4567"
}
],
"children": [
"Catherine",
"Thomas",
"Trevor"
],
"spouse": null
}
<?xml version="1.0"?>
<catalog>
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
<genre>Computer</genre>
<price>44.95</price>
<publish_date>2000-10-01</publish_date>
<description>An in-depth look at creating applications
with XML.</description>
</book>
<book id="bk102">
<author>Ralls, Kim</author>
<title>Midnight Rain</title>
<genre>Fantasy</genre>
<price>5.95</price>
<publish_date>2000-12-16</publish_date>
<description>A former architect battles corporate zombies,
an evil sorceress, and her own childhood to become queen
of the world.</description>
</book>
<book id="bk103">
<author>Corets, Eva</author>
<title>Maeve Ascendant</title>
<genre>Fantasy</genre>
<price>5.95</price>
<publish_date>2000-11-17</publish_date>
<description>After the collapse of a nanotechnology
society in England, the young survivors lay the
foundation for a new society.</description>
</book>
</catalog>
Рабочая директория — папка, в которую по умолчанию смотрит R, когда начинает искать файлы.
[1] "/home/nglgrdt/"
/home/nglgrdt/R/wlm2023/pr1-course.R
wlm2023/pr1-course.R
Полезная вещь: ..
— подняться на один уровень в иерархии папок.
Компьютер умеет хранить только числа, а скрипт — это текст
Данные также часто содержат текст
Договорились, что буквеные символы будут храниться на железе компьютера в виде чисел и составили таблицы соответствий между числами и буквами
Такие таблицы были названы кодировками
Кодировок много, так как они создавались для разных алфавитов и задач
Стандартной считается UTF-8
При работе с нестандартными символами (например, диакритические знаки или фонетические символы) пригодится UTF-16
id var1 var2 var3 var4 var5
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
id var1 var2 var3 var4 var5
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
'data.frame': 7 obs. of 6 variables:
$ id : int 1 2 3 4 5 6 7
$ var1: chr "Abc" "Def" "Ghi" "Jkl" ...
$ var2: int 5 16 94 28 11 100 96
$ var3: logi TRUE FALSE FALSE FALSE TRUE TRUE ...
$ var4: chr "cond1" "cond1" "cond2" "cond2" ...
$ var5: num 12.8 14.2 32.5 9.4 6.3 11.7 95.5
id var1 var2 var3
Min. :1.0 Length:7 Min. : 5.0 Mode :logical
1st Qu.:2.5 Class :character 1st Qu.: 13.5 FALSE:4
Median :4.0 Mode :character Median : 28.0 TRUE :3
Mean :4.0 Mean : 50.0
3rd Qu.:5.5 3rd Qu.: 95.0
Max. :7.0 Max. :100.0
var4 var5
Length:7 Min. : 6.30
Class :character 1st Qu.:10.55
Mode :character Median :12.80
Mean :26.06
3rd Qu.:23.35
Max. :95.50
id var1 var2 var3 var4 var5
[1,] FALSE FALSE FALSE FALSE FALSE FALSE
[2,] FALSE FALSE FALSE FALSE FALSE FALSE
[3,] FALSE FALSE FALSE FALSE FALSE FALSE
[4,] FALSE FALSE FALSE FALSE FALSE FALSE
[5,] FALSE FALSE FALSE FALSE FALSE FALSE
[6,] FALSE FALSE FALSE FALSE FALSE FALSE
[7,] FALSE FALSE FALSE FALSE FALSE FALSE
tidyverse
Установить пакет:
Подключить пакет к текущей сессии R:
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.5
✔ forcats 1.0.0 ✔ stringr 1.5.1
✔ ggplot2 3.5.1 ✔ tibble 3.2.1
✔ lubridate 1.9.3 ✔ tidyr 1.3.1
✔ purrr 1.0.2
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
tibble
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
Существует два вида пайпа:
%>%
tidyverse
|>
Tools > Global Options > Code > Use native pipe operator
С точки зрения пользователя практически не отличаются друг от друга.
Пайп передает то, что слева от него, в функцию, которая справа от него, в качестве первого аргумента.
Позволяет выстраивать цепочки последовательных преобразований:
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id city age var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
`~id` `~city` `~age` `~student` `~condition` `~score`
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id city age student condition score
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 5 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 6 Pqr 100 TRUE cond3 11.7
5 7 Stu 96 FALSE cond1 95.5
# A tibble: 3 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 5 Mno 11 TRUE cond3 6.3
3 6 Pqr 100 TRUE cond3 11.7
# A tibble: 3 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 3 Ghi 94 FALSE cond2 32.5
2 4 Jkl 28 FALSE cond2 9.4
3 5 Mno 11 TRUE cond3 6.3
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 4
id var1 var3 var4
<dbl> <chr> <lgl> <chr>
1 1 Abc TRUE cond1
2 2 Def FALSE cond1
3 3 Ghi FALSE cond2
4 4 Jkl FALSE cond2
5 5 Mno TRUE cond3
6 6 Pqr TRUE cond3
7 7 Stu FALSE cond1
# A tibble: 7 × 5
var1 var2 var3 var4 var5
<chr> <dbl> <lgl> <chr> <dbl>
1 Abc 5 TRUE cond1 12.8
2 Def 16 FALSE cond1 14.2
3 Ghi 94 FALSE cond2 32.5
4 Jkl 28 FALSE cond2 9.4
5 Mno 11 TRUE cond3 6.3
6 Pqr 100 TRUE cond3 11.7
7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 5 Mno 11 TRUE cond3 6.3
2 4 Jkl 28 FALSE cond2 9.4
3 6 Pqr 100 TRUE cond3 11.7
4 1 Abc 5 TRUE cond1 12.8
5 2 Def 16 FALSE cond1 14.2
6 3 Ghi 94 FALSE cond2 32.5
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 7 Stu 96 FALSE cond1 95.5
2 3 Ghi 94 FALSE cond2 32.5
3 2 Def 16 FALSE cond1 14.2
4 1 Abc 5 TRUE cond1 12.8
5 6 Pqr 100 TRUE cond3 11.7
6 4 Jkl 28 FALSE cond2 9.4
7 5 Mno 11 TRUE cond3 6.3
# A tibble: 4 × 2
var4 var3
<chr> <lgl>
1 cond1 TRUE
2 cond1 FALSE
3 cond2 FALSE
4 cond3 TRUE
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 7 × 7
id var1 var2 var3 var4 var5 banch
<dbl> <chr> <dbl> <lgl> <chr> <dbl> <dbl>
1 1 Abc 5 TRUE cond1 12.8 1
2 2 Def 16 FALSE cond1 14.2 1
3 3 Ghi 94 FALSE cond2 32.5 1
4 4 Jkl 28 FALSE cond2 9.4 1
5 5 Mno 11 TRUE cond3 6.3 1
6 6 Pqr 100 TRUE cond3 11.7 1
7 7 Stu 96 FALSE cond1 95.5 1
ds %>%
mutate(banch = 1,
var5_cat = ifelse(var5 > mean(var5), "high", "low"),
var4 = recode(var4,
"cond1" = "easy",
"cond2" = "medium",
"cond3" = "hard"))
# A tibble: 7 × 8
id var1 var2 var3 var4 var5 banch var5_cat
<dbl> <chr> <dbl> <lgl> <chr> <dbl> <dbl> <chr>
1 1 Abc 5 TRUE easy 12.8 1 low
2 2 Def 16 FALSE easy 14.2 1 low
3 3 Ghi 94 FALSE medium 32.5 1 high
4 4 Jkl 28 FALSE medium 9.4 1 low
5 5 Mno 11 TRUE hard 6.3 1 low
6 6 Pqr 100 TRUE hard 11.7 1 low
7 7 Stu 96 FALSE easy 95.5 1 high
# A tibble: 7 × 6
id var1 var2 var3 var4 var5
<dbl> <chr> <dbl> <lgl> <chr> <dbl>
1 1 Abc 5 TRUE cond1 12.8
2 2 Def 16 FALSE cond1 14.2
3 3 Ghi 94 FALSE cond2 32.5
4 4 Jkl 28 FALSE cond2 9.4
5 5 Mno 11 TRUE cond3 6.3
6 6 Pqr 100 TRUE cond3 11.7
7 7 Stu 96 FALSE cond1 95.5
# A tibble: 1 × 2
v5_mean v2_median
<dbl> <dbl>
1 26.1 28
# A tibble: 3 × 4
var4 n v5_mean v2_median
<chr> <int> <dbl> <dbl>
1 cond1 3 40.8 16
2 cond2 2 21.0 61
3 cond3 2 9 55.5
# A tibble: 3 × 4
var4 n v5_mean v2_median
<chr> <int> <dbl> <dbl>
1 cond1 3 40.8 16
2 cond2 2 21.0 61
3 cond3 2 9 55.5
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 3 Ghi 94
4 4 Jkl 28
# A tibble: 4 × 3
id var3 var4
<dbl> <lgl> <chr>
1 1 TRUE cond1
2 2 FALSE cond1
3 3 FALSE cond2
4 4 FALSE cond2
# A tibble: 3 × 3
id var1 var2
<dbl> <chr> <dbl>
1 5 Mno 11
2 6 Pqr 100
3 7 Stu 96
# A tibble: 4 × 6
id...1 var1 var2 id...4 var3 var4
<dbl> <chr> <dbl> <dbl> <lgl> <chr>
1 1 Abc 5 1 TRUE cond1
2 2 Def 16 2 FALSE cond1
3 3 Ghi 94 3 FALSE cond2
4 4 Jkl 28 4 FALSE cond2
# A tibble: 7 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 3 Ghi 94
4 4 Jkl 28
5 5 Mno 11
6 6 Pqr 100
7 7 Stu 96
inner_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 2 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 2 Def 16 cond1 14.2
left_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 4 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 2 Def 16 cond1 14.2
3 5 Mno 11 <NA> NA
4 7 Stu 96 <NA> NA
right_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 4 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 2 Def 16 cond1 14.2
3 3 <NA> NA cond2 32.5
4 4 <NA> NA cond2 9.4
full_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 6 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 2 Def 16 cond1 14.2
3 5 Mno 11 <NA> NA
4 7 Stu 96 <NA> NA
5 3 <NA> NA cond2 32.5
6 4 <NA> NA cond2 9.4
semi_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 2 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
# A tibble: 2 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
anti_join()
# A tibble: 4 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 2 Def 16
3 5 Mno 11
4 7 Stu 96
# A tibble: 4 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 3 cond2 32.5
4 4 cond2 9.4
# A tibble: 2 × 3
id var1 var2
<dbl> <chr> <dbl>
1 5 Mno 11
2 7 Stu 96
# A tibble: 2 × 3
id var3 var4
<dbl> <chr> <dbl>
1 3 cond2 32.5
2 4 cond2 9.4
# A tibble: 5 × 3
id var1 var2
<dbl> <chr> <dbl>
1 1 Abc 5
2 1 Abc 7
3 2 Def 16
4 5 Mno 11
5 7 Stu 96
# A tibble: 5 × 3
id var3 var4
<dbl> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 2 cond2 2
4 3 cond2 32.5
5 4 cond2 9.4
# A tibble: 4 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 1 Abc 7 cond1 12.8
3 2 Def 16 cond1 14.2
4 2 Def 16 cond2 2
# A tibble: 6 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 1 Abc 7 cond1 12.8
3 2 Def 16 cond1 14.2
4 2 Def 16 cond2 2
5 5 Mno 11 <NA> NA
6 7 Stu 96 <NA> NA
# A tibble: 6 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 1 Abc 7 cond1 12.8
3 2 Def 16 cond1 14.2
4 2 Def 16 cond2 2
5 3 <NA> NA cond2 32.5
6 4 <NA> NA cond2 9.4
# A tibble: 8 × 5
id var1 var2 var3 var4
<dbl> <chr> <dbl> <chr> <dbl>
1 1 Abc 5 cond1 12.8
2 1 Abc 7 cond1 12.8
3 2 Def 16 cond1 14.2
4 2 Def 16 cond2 2
5 5 Mno 11 <NA> NA
6 7 Stu 96 <NA> NA
7 3 <NA> NA cond2 32.5
8 4 <NA> NA cond2 9.4
# A tibble: 6 × 3
id var1 var2
<int> <chr> <dbl>
1 1 cond1 12.8
2 2 cond1 14.2
3 1 cond2 32.5
4 2 cond2 9.4
5 1 cond3 6.3
6 2 cond3 11.7
# A tibble: 2 × 4
id cond1 cond2 cond3
<int> <dbl> <dbl> <dbl>
1 1 12.8 32.5 6.3
2 2 14.2 9.4 11.7
# A tibble: 6 × 3
id name value
<int> <chr> <dbl>
1 1 cond1 12.8
2 1 cond2 32.5
3 1 cond3 6.3
4 2 cond1 14.2
5 2 cond2 9.4
6 2 cond3 11.7
Два специализированных пакета:
stringr
(является частью tidyverse
)stringi
(устанавливается отдельно)s1 <- "сложившаяся структура организации влечет за собой процесс внедрения и модернизации новых предложений"
s1
[1] "сложившаяся структура организации влечет за собой процесс внедрения и модернизации новых предложений"
s2 <- 'С другой стороны постоянный количественный "рост" и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации'
s2
[1] "С другой стороны постоянный количественный \"рост\" и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
s3 <- "С другой стороны постоянный количественный "рост" и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
s3
Error: <text>:1:52: unexpected symbol
1: s3 <- "С другой стороны постоянный количественный "рост
^
s4 <- "С другой стороны постоянный количественный 'рост' и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
s4
[1] "С другой стороны постоянный количественный 'рост' и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
s5 <- "С другой стороны постоянный количественный «рост» и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
s5
[1] "С другой стороны постоянный количественный «рост» и сфера нашей активности позволяет выполнять важные задания по разработке соответствующий условий активизации"
# A tibble: 150 × 4
id scale item score
<int> <chr> <int> <int>
1 1 A 1 5
2 1 A 2 3
3 1 A 3 5
4 1 A 4 4
5 1 A 5 1
6 1 B 1 3
7 1 B 2 2
8 1 B 3 2
9 1 B 4 1
10 1 B 5 1
# ℹ 140 more rows
# A tibble: 150 × 3
id scale_item score
<int> <chr> <int>
1 1 A_1 5
2 1 A_2 3
3 1 A_3 5
4 1 A_4 4
5 1 A_5 1
6 1 B_1 3
7 1 B_2 2
8 1 B_3 2
9 1 B_4 1
10 1 B_5 1
# ℹ 140 more rows
[1] "Odl" "Snm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "Swx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "Szq"
[1] "Ccw" "Cka" "Ejt" "Eph" "Gbz" "Hfj" "Ixs" "Iyc" "Jgf" "Jhe" "Koi" "Nqr"
[13] "Nvd" "Odl" "Ruu" "Snm" "Swx" "Szq" "Tmp" "Vin" "Vlo" "Yey" "Ysv" "Ytg"
[25] "Zab" "Zrk"
[1] "Ccw" "Cka" "Ejt" "Eph" "Gbz" "Hfj" "Ixs" "Iyc" "Jgf" "Jhe" "Koi" "Nqr"
[13] "Nvd" "Odl" "Ruu" "Snm" "Swx" "Szq" "Tmp" "Vin" "Vlo" "Yey" "Ysv" "Ytg"
[25] "Zab" "Zrk"
[1] "Odl" "Snm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "Swx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "Szq"
[1] "Od" "Sn" "Nq" "Ck" "Jg" "Ru" "Vl" "Ko" "Ej" "Tm" "Nv" "Vi" "Ys" "Zr" "Ep"
[16] "Sw" "Ye" "Yt" "Ix" "Cc" "Hf" "Za" "Gb" "Jh" "Iy" "Sz"
[1] "Odl" "Snm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "Swx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "Szq"
[1] "Ьdl" "Snm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "Swx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "Szq"
[1] "Odl" "Snm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "Swx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "Szq"
[1] "Odl" "nm" "Nqr" "Cka" "Jgf" "Ruu" "Vlo" "Koi" "Ejt" "Tmp" "Nvd" "Vin"
[13] "Ysv" "Zrk" "Eph" "wx" "Yey" "Ytg" "Ixs" "Ccw" "Hfj" "Zab" "Gbz" "Jhe"
[25] "Iyc" "zq"
[1] "21.92.2001" "01.04.1994" "5-3-2011" "6/04/1999"
[1] │ <2><1><.><9><2><.><2><0><0><1>
[2] │ <0><1><.><0><4><.><1><9><9><4>
[3] │ <5><-><3><-><2><0><1><1>
[4] │ <6></><0><4></><1><9><9><9>
[1] │ 21<.>92<.>2001
[2] │ 01<.>04<.>1994
[3] │ 5-3-2011
[4] │ 6/04/1999
[1] │ 21.92.2001
[2] │ <0>1.04.1994
[3] │ 5-3-2011
[4] │ 6/04/1999
[1] │ <2><1>.<9><2>.<2><0><0><1>
[2] │ <0><1>.<0><4>.<1><9><9><4>
[3] │ <5>-<3>-<2><0><1><1>
[4] │ <6>/<0><4>/<1><9><9><9>
[1] │ 21<.>92<.>2001
[2] │ 01<.>04<.>1994
[3] │ 5<->3<->2011
[4] │ 6</>04</>1999
[1] │ <в><е><р><н><о> <в><е><д><ь>, <ч><т><о> <з><д><е><с><ь> <ч><т><о>-<т><о> <е><с><т><ь>
?
— ноль или один раз*
— ноль или более раз+
— один или более раз{n}
— n разВсе это автоматически обрабатывает lubridate
.
yyyy-mm-dd
— является международным стандартом
dd/mm/yy
, dd/mm/yyyy
, dd.mm.yyyy
— используется в Европеmm/dd/yy
, mm/dd/yyyy
— используется в СШАspc_tbl_ [44 × 4] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ id : num [1:44] 1 1 1 1 2 2 2 2 3 3 ...
$ dataset: num [1:44] 1 2 3 4 1 2 3 4 1 2 ...
$ x : num [1:44] 10 10 10 8 8 8 8 8 13 13 ...
$ y : num [1:44] 8.04 9.14 7.46 6.58 6.95 8.14 6.77 5.76 7.58 8.74 ...
- attr(*, "spec")=
.. cols(
.. id = col_double(),
.. dataset = col_double(),
.. x = col_double(),
.. y = col_double()
.. )
- attr(*, "problems")=<externalptr>
# A tibble: 4 × 7
dataset n mean_x mean_y sd_x sd_y cor
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 11 9 7.5 3.32 2.03 0.82
2 2 11 9 7.5 3.32 2.03 0.82
3 3 11 9 7.5 3.32 2.03 0.82
4 4 11 9 7.5 3.32 2.03 0.82
spc_tbl_ [1,846 × 3] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ dataset: chr [1:1846] "dino" "dino" "dino" "dino" ...
$ x : num [1:1846] 55.4 51.5 46.2 42.8 40.8 ...
$ y : num [1:1846] 97.2 96 94.5 91.4 88.3 ...
- attr(*, "spec")=
.. cols(
.. dataset = col_character(),
.. x = col_double(),
.. y = col_double()
.. )
- attr(*, "problems")=<externalptr>
# A tibble: 13 × 7
dataset n mean_x mean_y sd_x sd_y cor
<chr> <int> <dbl> <dbl> <dbl> <dbl> <dbl>
1 away 142 54.3 47.8 16.8 26.9 -0.1
2 bullseye 142 54.3 47.8 16.8 26.9 -0.1
3 circle 142 54.3 47.8 16.8 26.9 -0.1
4 dino 142 54.3 47.8 16.8 26.9 -0.1
5 dots 142 54.3 47.8 16.8 26.9 -0.1
6 h_lines 142 54.3 47.8 16.8 26.9 -0.1
7 high_lines 142 54.3 47.8 16.8 26.9 -0.1
8 slant_down 142 54.3 47.8 16.8 26.9 -0.1
9 slant_up 142 54.3 47.8 16.8 26.9 -0.1
10 star 142 54.3 47.8 16.8 26.9 -0.1
11 v_lines 142 54.3 47.8 16.8 26.9 -0.1
12 wide_lines 142 54.3 47.8 16.8 26.9 -0.1
13 x_shape 142 54.3 47.8 16.8 26.9 -0.1
Больше примеров странных визуализаций тут.
Эти принципы легли в основу пакета ggplot2
.
tidyverse
достаточно интуитивно реализованыАнтон Ангельгардт
WLM 2023