Zdá se, že na všechno stačí Python. Můžete napsat skript pro server, analyzovat data a trénovat neuronovou síť. Navíc má spoustu knihoven pro statistiky a analýzu dat — můžete použít kteroukoli z nich.
jak používat měnič hlasu při sváru
Existuje však další jazyk — R — pro analýzu a práci se statistikami. Mnoho studentů se při studiu statistiky musí s tímto programovacím jazykem potýkat. Náš bláznivý životní rytmus nás často nutí přizpůsobovat se okolnostem a studovat, dělat domácí úkoly nebo dokonce pracovat z našich telefonů. Pokud jste se někdy divili, jak mohu udělat můj domácí úkol na smartphonu pokračujte ve čtení.
ObsahCo je R?
Jedná se o programovací jazyk používaný statistiky a sběrateli dat pro statistické výpočty a grafiku. První verze jazyka R se objevila v roce 1993, o dva roky později než Python. V té době Python ještě nebyl tak populární a neměl tolik knihoven pro analýzu dat jako nyní. Vědci z katedry statistiky na Oaklandské univerzitě proto vytvořili jazyk pro své interní úkoly. A protože se jmenovali Ross a Robert, pojmenovali jazyk podle prvního písmene svého jména, R.
R byl původně vyvinut jako interní nástroj na fakultě k řešení jejich statistických problémů. Ale v té době bylo pro vědce dobré sdílet svou práci se všemi, a tak otevřeli zdrojový kód jazyka, aby jej každý mohl vylepšit nebo přidat něco užitečného. Od té doby se jazyk rozrostl z fakultního projektu na celosvětově oblíbený statistický nástroj.
Charakteristika R jako programovacího jazyka
Vzhledem k tomu, že tento jazyk byl vynalezen pro vědecké účely, autoři se nesnažili, aby byl intuitivní. Předpokládali, že jej budou používat lidé obeznámení s matematickou analýzou, statistickými metodami a variacemi pravděpodobnosti. Proto se R může zdát jako velmi komplikovaný jazyk, ačkoliv je uvnitř velmi jednoduchý a logický.
Také čtěte Proč studenti potřebují pomoc s domácími úkoly v jazyce Java?
K čemu se R používá?
Hlavním využitím R je analyzovat data a vyvozovat z nich závěry:
- vizualizace dat jakýmkoliv způsobem
- shromažďovat a analyzovat data z různých zdrojů
- práce se statistikami, hledání anomálií v datech
- hledání vzorů a odlehlých hodnot v datech
- testování a potvrzování hypotéz.
Samostatným směrem v R je strojové učení a neuronové sítě. Vzhledem k tomu, že jazyk R byl původně navržen pro zpracování obrovského množství dat, je snadné zorganizovat model hlubokého učení nebo vytvořit novou neuronovou síť.
Co můžete dělat s R
- Zpracovávejte, čistěte a transformujte data pro výzkum. Chcete například vidět, kolik studentů průměrně navštěvovalo knihovnu každý zimní a podzimní měsíc. R umožňuje vyloučit jaro a léto a seskupit je podle měsíců pro další výpočty.
- Své výsledky můžete převést do webové aplikace. Bude plně interaktivní, nabídne filtry, grafy a dokonce i třídič dat. Můžete jej poslat svému profesorovi nebo publikovat jako součást své práce. Takto sledují výskyt koronaviru po celém světě (kód je otevřený a dostupný na GitHubu).
- Spusťte statistické testy. Předpokládejme, že chcete vědět, zda se úroveň IQ dvou pohlaví liší. S tím vám může pomoci t-test. Test zobrazí statistický rozdíl mezi přijatými daty, pokud existuje.
- Můžete provést průzkumnou analýzu. Protože mnoho statistických metod potřebuje rozdělení v nezpracovaných datech, musíte zkontrolovat jejich normalitu. Co je normální rozdělení? Je to tehdy, když je většina dat seskupena kolem střední hodnoty. Zbytek hodnot je výrazně menší. Toto rozdělení můžete vidět v životě: existuje více lidí s průměrnou výškou než těch, kteří jsou vysocí nebo nižší. R nabízí nástroje pro kontrolu normality pomocí grafů a testů.
- Kombinujte různé formáty tabulek. Konečně můžete použít různé formáty tabulek a sloučit dva z nich do jednoho dokumentu pro analýzu dat.
- Svá data můžete prezentovat v interaktivních grafech s úpravou všech parametrů (hodnoty os atd.).
- Provádět regresní analýzu a vytvářet regresní modely. Tato analýza pomáhá rozlišit vztah mezi závislými a nezávislými proměnnými. Řekněme, že chcete zjistit, proč některá kosmetická studia ve stejné ulici mají vyšší tržby než jiná. Závislou proměnnou bude počet prodejů. Nezávislé proměnné by zahrnovaly sociální status a věk obyvatel sousedství a ceník každého studia za stejné procedury. Můžete tak zjistit, který z těchto faktorů ovlivňuje prodej v obchodě více než ostatní.
Klady R
- Neomezená sada funkcí pro analýzu dat díky propojení knihoven.
- Schopnost pracovat s obrovskými tabulkami a databázemi, se kterými si programy neporadí.
- Pokročilé přizpůsobení rozhraní: grafické uživatelské rozhraní nebo rozhraní příkazového řádku.
- Zcela bezplatný ekosystém — komponenty jsou distribuovány zdarma pod licencí GNU.
- Dostupné pro většinu operační systémy : Windows, macOS, FreeBSD, Solaris, různé verze Unixu a Linuxu.
- Bohaté možnosti vizualizace: můžete vytvářet aplikace, sestavovat grafy různých typů, včetně interaktivních, a také upravovat jejich prvky.
- Spousta informací a aktivní komunita: blog, diskuze R a RStudio, lekce a konference.
- Rozsáhlá a přehledná dokumentace: jsou zde popisy všech knihoven a příklady použití.
Nevýhody R
- Člověk bez zkušeností s programováním a znalostí základů statistiky to může považovat za náročné.
- Úzký rozsah: je ideální pro analýzu dat, ale není vhodný pro vývoj softwaru. Ale v tom je její síla. Skutečný způsob UNIXu a dar z nebes pro vědce, novináře, datové vědce, analytiky – každého, kdo chce pracovat s daty.
Jak se vypořádat s domácími úkoly R na vašem telefonu?
Již jsme zmínili aplikace s knihovnami, které můžete použít pro práci s R, jsou dostupné na všech OS. Ale co smartphony? Existuje způsob, jak používat RStudion v telefonu, nikoli prostřednictvím speciální aplikace, ale prostřednictvím jeho open-source serveru. Můžete jej získat prostřednictvím jakéhokoli webového prohlížeče. Stačí tedy spustit server RStudion na vašem počítači nebo notebooku a přistupovat k němu na vašem telefonu. Je to skvělý a jednoduchý způsob, jak pracovat na domácích úkolech R kdekoli a kdykoli.