User Tools

Site Tools


Sidebar

Vít Syrovátka

Úvod do R


Teorie

Sekce Teorie je (a asi ještě dlouho bude) v průběžné výstavbě.

Software

Objekty v R

Cvičení

Data

Zápočet

Další zdroje

R for Data Science (2017) - excelentní tutorial Hadleyho Wickhama následující filozofii tidyversu
Data Processing with dplyr & tidyr - tutorial na úpravu dataframů pomocí tidyversových balíků dplyr a tidyr

r_intro:cs:data:jmena

Křestní jména obyvatel ČR 2013

Data o výskytu všech 16393 jednoslovných křestních jmen v jednotlivých ročnících od r. 1896 do 2013 v ČR.

Data ve formě tabulátorem odděleného textu .txt stáhněte zde.

Pro přímé načtení do R použijte cestu k souboru:

url("https://vitsyrovatka.info/lib/exe/fetch.php?media=r_intro:data:jmena.txt")

Proměnné datasetu

  • první, bezejmenný, sloupec obsahuje seznam všech jednoslovných křestních jmen,
  • druhý sloupec, “0”, obsahuje frekvence jmen u ročníků starších, než narozených v roce 1896,
  • všechny další sloupce (“1896” - “2013”) pak frekvence jmen v jednotlivých ročnících od roku narození 1896 do 2013 (118 sloupců).
  • Poslední sloupec “2014” je prázdný (plný nul).

Data byla stažena 2014 ze stránek ministerstva vnitra, pouze byla odfiltrována víceslová jména.

r_intro/cs/data/jmena.txt · Last modified: 2018/11/15 09:50 by vitek