R — это язык программирования с открытым исходным кодом, который широко используется как статистическое программное обеспечение и инструмент анализа данных. R обычно поставляется с интерфейсом командной строки и доступен на широко используемых платформах, таких как Windows, Linux и macOS.
Он был разработан Россом Айхэкой и Робертом Джентлменом в Университете Окленда в Новой Зеландии и в настоящее время разрабатывается командой разработки R. Язык программирования R является реализацией языка программирования S. Он также объединяет семантику лексического замыкания, вдохновленную Scheme. Кроме того, проект был создан в 1992 году, первая версия была выпущена в 1995 году, а стабильная бета-версия — в 2000 году.
Почему язык программирования R?
Язык программирования R используется как основной инструмент для машинного обучения, статистики и анализа данных. Объекты, функции и пакеты могут легко создаваться с использованием этого языка.
Кроссплатформенность. Не зависит от платформы и доступен на всех операционных системах.
Это бесплатный open-source язык, любой желающий может установить его.
R позволяет интеграцию с другими языками программирования (C, C++, Python). Таким образом, можно легко взаимодействовать со многими источниками данных и статистическими пакетами.
R имеет обширное сообщество пользователей, которое растет с каждым днем.
R является одним из наиболее востребованных языков программирования в сфере работы с данными (Data Science, Big Data).
Особенности языка программирования R
Статистические возможности R
Базовая статистика: Самые распространенные термины базовой статистики — это среднее значение, мода и медиана. Все они известны как меры центральной тенденции. С помощью языка R, например, можно легко измерять центральную тенденцию.
Статическая графика: R содержит функциональность для многих типов графиков, включая графические карты, мозаичные графики, двойные графики и т.д.
Распределение вероятностей: С помощью R можно легко обрабатывать различные типы распределения вероятности, такие как биномиальное распределение, нормальное распределение, распределение хи-квадрат и многие другие.
Анализ данных: R предоставляет большую, согласованную и интегрированную коллекцию инструментов для анализа данных.
Особенности программирования на R
Пакеты R: R имеет репозиторий CRAN (сокр. от англ. «Comprehensive R Archive Network«), который содержит более 10 000 пакетов.
Распределенные вычисления: Распределенные вычисления — это модель, в которой компоненты программной системы используются на нескольких компьютерах для повышения эффективности и производительности. В ноябре 2015 года были выпущены два новых пакета ddR и multidplyr, используемые для распределенного программирования на R.
Программирование на R
Поскольку R синтаксически очень похож на другие широко используемые языки программирования, программировать на нем несложно. Программы на R можно писать в любой популярной среде разработки, такой как R Studio, Rattle, Tinn-R и др. После написания программы сохраните файл с расширением .r.
Для запуска программы используйте следующую команду в командной строке:
R название_файла.r
Пример:
1 2 |
# R-программа, которая выведет на экран "Welcome to R programming!" cat("Welcome to R programming!") |
Результат:
Welcome to R programming!
Преимущества R
R является наиболее полным пакетом для статистического анализа, поскольку новые технологии и концепции часто появляются в R первыми.
R является языком программирования с открытым исходным кодом.
R является кроссплатформенным и работает в большинстве операционных систем Linux и Windows.
R позволяет каждому предоставлять новые пакеты, исправления ошибок и улучшения кода.
Недостатки R
Не все пакеты в R идеальны (по стандартам).
R может быть медленным в работе с большими объемами данных, в частности, если размер оперативной памяти на рабочем устройстве недостаточен.
Некоторые пользователи считают, что визуализация данных в R не так проста, как в других инструментах.
Коммерческая поддержка для R недостаточно развита в сравнении с другими инструментами для анализа данных.
Применения R
R используется в Data Science и Big Data. Он предоставляет широкий выбор библиотек, связанных со статистикой, а также среду для статистического вычисления и проектирования.
R используется многими статистическими аналитиками как инструмент программирования. Он помогает импортировать, анализировать и модифицировать данные.
Многие аналитики данных и исследовательские программисты используют язык R. Также он используется как основной инструмент в сфере работы с финансами.
Технологические гиганты, такие как Google, Facebook, Bing, Twitter, Accenture, Wipro и многие другие, используют R.