User Tools

Site Tools


Sidebar

Vít Syrovátka

Úvod do R


Teorie

Sekce Teorie je (a asi ještě dlouho bude) v průběžné výstavbě.

Software

Objekty v R

Cvičení

Data

Zápočet

Další zdroje

R for Data Science (2017) - excelentní tutorial Hadleyho Wickhama následující filozofii tidyversu
Data Processing with dplyr & tidyr - tutorial na úpravu dataframů pomocí tidyversových balíků dplyr a tidyr

r_intro:cs:theory:rstudio

Základy práce v RStudiu

Po prvním spuštění RStudia je jeho levá část vyplněná R konzolí, vpravo pak jsou 2 okna nad sebou s několika záložkami. Nahoře záložky Environment, ve které se nám budou objevovat vytvářené objekty, a History, kde najdeme historii příkazů, které jsme zadali R ke zpracování. Dole Files připomíná průzkumníka, zobrazuje složky a soubory v pracovním adresáři. Pod záložkou Plots se nám budou zobrazovat grafy, v Packages je možné spravovat nástavbové balíky, Help zobrazuje nápovědu k funkcím, a pomocí Viewer je možné prohlížet lokální webový obsah, např. při tvorbě webové grafiky.

Obr. 1: RStudio po prvním spuštění.

Okno editoru

Do levého okna R konzole můžeme vepisovat příkazy a odklepávat je klávesou Enter. Pro plnou možnost editace kódu ale potřebujeme otevřít nový R script soubor. To provedeme kliknutím na File / New File / R Script. Poslouží i klávesová zkratka Ctrl + Shift + N. Nyní se nám levé okno rozdělilo na dvě, nad konzolí se objevil soubor, v němž budeme psát a editovat příkazy a odtud je budeme posílat do R konzole pod ním. K odeslání příkazu slouží klávesová zkratka Ctrl + Enter, případně Ctrl + R a odeslán je řádek, na němž je umístěn kurzor, nebo označený blok kódu (označení provedeme jako v jiných editorech stisknutím klávesy Shift a pohybem kurzoru pomocí šipek).

Obr. 2: RStudio s otevřeným editačním oknem.

Okna RStudia je možné popřesouvat, zvětšit či zmenšit, nebo barevně stylizovat dle uživatelových preferncí. Úpravu velikostí provedeme tažením myší za příčky mezi okny. Ostatní upravíme v Tools / Global Options… / Appearance a Pane Layout.

Obr. 3: Uživatelsky upravené RStudio.

Práce s projekty

RStudio umožňuje organizaci souborů do projektů. Výhodou projektů je jejich snadná přenositelnost na jiné počítače, přičemž zůstanou zachovány fungující vazby mezi soubory, například cesty k datovým souborům. Zároveň se při spuštění projektu načte pracovní prostředí projektu se všemi vytvořenými objekty, takže pokračujeme v práci tam, kde jsme minule skončili.
Projekt vytvoříme rozbalením nabídky vpravo nahoře Project: (None) a vybráním New Project…. Projekt pak vytvoříme buď do nového adresáře, nebo do stávajícího. Dovnitř tohoto adresáře pak ukládáme data používaná v analýzách daného projektu a výsledky. Potřebujeme-li na daném projektu pracovat na jiném počítači, stačí tento adresář přenést a spustit soubor s příponou .RProj.

Obr. 4: Zde spustíme dialog pro správu projektů.

Vkládání poznámek do scriptu

Abychom se v kódu dokázali orientovat i po delší době, je důležité jej důsledně komentovat. Dělat si poznámky, co vlastně ta která část kódu dělá, případně i postřehy z analýz, myšlenkové postupy, proč takhle pokračujeme v analýzách, atd. Veškeré poznámky se píší za hashtag #. Jakmile R narazí na hashtag, daný řádek dál již nečte, přeskočí zbytek řádku. Je možné jej použí na začátku řádku i uprostřed, za příkazem.
Delší poznámky, komentáře analýz, myšlenkové postupy a podobně je vhodné psát za hashtag doplněný apostrofem #'. Ten se automaticky objeví na každém novém řádku po odklepnutí Enter. Takto psané poznámky je možné dokonce editovat, vytvářet nadpisy, seznamy, zvýrazňovat, atd. To se vše odehrává pomocí jazyka markdown a formátování se projeví až ve zprávě, kterou z daného .R souboru zkompilujeme. O kompilaci zprávy viz další odstavec. Editační možnosti najdete např. na tomto cheatsheetu. Zde je malá ukázka, jak vypadá komentovaný script v RStudiu:

#' Tady je velky nadpis
#' ====================
#' 
#' Tady mensi
#' --------------------
#' 
#' A tady pokracuje text, kde chci stucne vysvetlit, jak se pisi poznamky v RStudiu, 
#' ktere to pak cele pochrousta a zkompiluje spolu s erkovym kodem a vysledky mych slozitych vypoctu.
 
1 + 1 # tezky priklad, jsem zvedav, jak to dopadne
 
#' Vysledek je veru **necekany!**
#' A to jsem ani _nepouzil_ vsechny moznosti zvyrazneni textu...\
#' Jeste zkusim skocit na dalsi radek.

Kompilace zprávy

RStudio umožňuje kompilovat příkazy s poznámkami, výsledky a grafy do jedné zprávy. Abychom mohli kompilovat, musíme mít nainstalovaný balík knitr. (Jak instalovat balíky zde). Pokud nám chybí ještě nějaký jiný balík R nás vyzve k jeho instalaci a nabídne automatickou instalaci. Ta někdy nestačí. V tom případě instalujte sami podle stejného návodu. Kompilovat můžeme buď do formátu html, nebo docx. Do pdf pak tehdy, pokud máme nainstalovaný LaTeX. A konečně, kompilaci provedeme stisknutím klávesové zkratky Ctrl + Shift + K, kliknutím na ikonku sešitu v kroužkové vazbě, nebo kliknutím na File/Knit Document.

Obr. 5: Zde je tlačítko, které spustí kompilaci.

A jak dopadla kompilace:

Obr. 6: Výsledek kompilace komentovaného scriptu předchozí ukázky.

Aby kompilace v pořádku proběhla, musí kompilovaný script být zcela samonosný (tím myslím, že ho stačí vložit do R s prázdným pracovním prostředím a bude vše fungovat), nesmí generovat chybové hlášky a nelze uvnitř něj instalovat balíky. Pokud kompilace nechce proběhnout, zkontrolujte, zda uvnitř scriptu neinstalujete nějaký balík, otevřete si R konzoli (prázdnou) a příkazy postupně do konzole vkládejte a povrzujte, abyste odhalili, který příkaz vrátí chybovou hlášku. Častou chybou je:

  • Nepřipojení knihovny používaných balíků
  • Instalace knihoven
  • Chybějící import dat
r_intro/cs/theory/rstudio.txt · Last modified: 2017/09/26 17:07 by vitek