R (R Project for Statistical Computing) to język programowania, środowisko obliczeniowe oraz graficzne. Został zaprojektowany z myślą o obliczeniach statystycznych, wizualizacji danych oraz tworzeniu wykresów, w tym 3D.
Język R jest powszechnie wykorzystywany w dziedzinach takich jak analiza danych i statystyka. W tej roli rywalizuje z Pythonem, choć R pozostaje głównie narzędziem do pracy w obszarze data science, podczas gdy Python jest bardziej uniwersalnym językiem ogólnego zastosowania.
R bywa także wykorzystywany w machine learning, jednak w tej dziedzinie Python jest zdecydowanie częstszym wyborem.
W biotechnologii, bioinformatyce i biostatystyce R jest standardem, a narzędzie Bioconductor, stworzone przez Roberta Gentlemana, stało się kluczowe w tej dziedzinie.
Przykłady firm korzystających z R:
Github to system kontroli wersji. Możesz znaleźć tam projekty open source w każdej technologii. Zobacz jakiego typu projekty wykorzystują język R oraz jak wygląda R od strony kodu. Zwróć uwagę na pliki z rozszerzeniem .R.
1# | ggplot2 | 6,550 |
2# | FriendsDontLetFriends | 6,473 |
3# | awesome-R | 6,036 |
4# | shiny | 5,381 |
5# | dplyr | 4,790 |
6# | r4ds | 4,597 |
7# | swirl_courses | 4,331 |
8# | stat_rethinking_2022 | 4,111 |
9# | ML_for_Hackers | 3,666 |
10# | data.table | 3,628 |
R nie należy do najłatwiejszych języków programowania, ale oferuje silne wsparcie w zakresie wizualizacji danych, co czyni go bardzo przyjaznym w kontekście analizy danych. Posiada szeroką gamę wbudowanych funkcji do obliczeń statystycznych, co stanowi przewagę nad Pythonem, który w tej dziedzinie polega głównie na zewnętrznych bibliotekach.
Jeśli jednak masz już doświadczenie z innym językiem programowania, Python może okazać się bardziej intuicyjny i przyjazny do nauki.
Przykładowa implementacja wyszukiwania binarnego:
# R
binarySearch <- function (array, x){
start <- 0;
end <- length(array) - 1;
while (start <= end) {
middle <- floor((start+end) / 2);
if (array[middle] == x) {
return(middle);
}
if(array[middle] > x){
end = middle - 1;
}
else{
start = middle + 1;
}
}
return -1;
}
library <- c("Algorytmy", "Czysty kod", "Harry Potter", "Illuminati", "Wzorce projektowe", "...");
# Dla wyszukiwania binarnego
# tablica musi być posortowana rosnąco
x = "Illuminati";
foundXAt = binarySearch(library, x);
print(paste("Znaleziono ", x, " na pozycji ", foundXAt));
# Znaleziono "Illuminati" na pozycji 4
R znajduje się dość daleko w rankingach popularności, co wynika z faktu, że jest językiem niszowym, skoncentrowanym na konkretnej dziedzinie. Niemniej, w ostatnich latach jego popularność wzrosła, szczególnie w kontekście data science.
Według TIOBE index, język R jest na 18 pozycji pod względem popularności. W ubiegłym roku był na pozycji 19.
Na Stack Overflow jest 7 najczęściej tagowanym językiem z 510,804 zapytaniami.
Na Github zajmuje 13 pozycję z liczbą 156,837 projektów, z których 78 ma więcej niż 1000 gwiazdek.
Jeśli chodzi o organizowane spotkania to według Meetup.com jest to 11 co do wielkości społeczność z liczbą 137 grup, w skład których wchodzi 114,481 członków na całym świecie. W Polsce mamy odpowiednio 1 grup, w skład których wchodzi 793 członków.
Zwiększone zainteresowanie w dziedzinach takich jak data science czy big data daje językowi R dobrą perspektywę na przyszłość. Niemniej, Python pozostaje mocnym konkurentem i często jest preferowanym językiem pierwszego wyboru.
R jest wciąż rozwijany, a jego ostatnia wersja 4.4.2 została wydana 31 października 2024.
(W języku polskim niżej)
R Programming A-Z™: R For Data Science With Real Exercises!
Learn Programming In R And R Studio. Data Analytics, Data Science, Statistical Analysis, Packages, Functions, GGPlot2
Czas trwania: 10.5 total hours 275048 zapisanych uczestnikówData Science and Machine Learning Bootcamp with R
Learn how to use the R programming language for data science and machine learning and data visualization!
Czas trwania: 18 total hours 96866 zapisanych uczestnikówR Ultimate 2024: R for Data Science and Machine Learning
R Basics, Data Science, Statistical Machine Learning models, Deep Learning, Shiny and much more (All R code included)
Czas trwania: 22.5 total hours 4329 zapisanych uczestnikówData science with R: tidyverse
R Programming Language, Data Analysis, Data Cleaning, Data Science, Data Wrangling, tidyverse, dplyr, ggplot2, RStudio
Czas trwania: 31 total hours 4323 zapisanych uczestnikówData Science - Język R dla początkujących
w sam raz na początek kariery w data science
Czas trwania: 10 total hours 2952 zapisanych uczestnikówAnaliza danych w środowisku R
Manipulacja, modelowanie i wizualizacja danych w praktyce
Czas trwania: 4 total hours 289 zapisanych uczestnikówPython 3 od Podstaw do Eksperta
Stworzony z myślą o osobach, które nie wiedzą nic na temat programowania w Python. Naucz się Pythona od zera!
Czas trwania: 20.5 total hours 36246 zapisanych uczestnikówTesty jednostkowe w języku Python - framework unittest
Efektywne testowanie jednostkowe w Pythonie: framework unittest w praktyce - zwiększ jakość i niezawodność Twojego kodu!
Czas trwania: 5 total hours 1109 zapisanych uczestników