Arkesys

Logiciel R / R Studio - Niveau 2 Orientation Programmation

Par Arkesys

Objectifs

  • Lire et écrire des scripts élaborés
  • Manipuler efficacement les objets R : vecteurs, facteurs, data frames, listes…
  • Contrôler le type des objets
  • Convertir les objets
  • Gérer efficacement les chaines de caractères
  • Gérer efficacement les dates
  • Trier, filtrer et fusionner des tableaux de données
  • Utiliser les méthodes de vetorisation
  • Utiliser des tests conditionnels et des boucles de répétition dans un programme
  • Utiliser les commandes de type apply afin d'éviter les boucles
  • Créer des fonctions personnelles d’automatisation des tâches
  • Optimiser un programme

Programme

Rappels sur les fondamentaux sur le logiciel R

  • Lire efficacement l'aide en ligne des commandes
  • Rechercher les commandes
  • Affichage, sauvegarde, suppression et chargement des objets en mémoire
  • Trucs et astuces

Utilisation des fonctions les plus courantes du logiciel R

  • Fonctions d’information sur les objets : which, unique, sort, duplicated…
  • Principales fonctions mathématiques : log, mean, median, cumsum…
  • Fonctions de type apply : apply, lapply, sapply, tapply
  • Fonctions dédiées au traitement des chaînes de caractères : paste, grep, match, %in%...

Manipulation des objets R

  • Création des objets R : vecteurs, facteurs, data frames, listes, listes imbriquées…
  • Manipulation efficace des objets R ci-dessus
    • Dimension de l'objet
    • Modification des noms
    • Extraction des éléments : à partir des indices, par le biais de conditions
    • Ajout et suppression d'un élément
  • Contrôle du type des objets et conversion des objets
    • Commandes is.something
    • Commandes as.something
    • Conversion d'une variable numérique en facteur
    • Conversion d'un facteur en variable numérique
    • Transformation d'une liste en vecteur

Manipulation des chaines de caractères et des dates

  • Concaténation des chaines de caractères
  • Extraction d'une partie d'une chaine de caractères
  • Recherche d'un pattern (motif)
  • Découpage des chaines de caractères
  • Remplacement d'une partie d'une chaine de caractères
  • Les commandes %in% et match
  • Gestion des dates par le package lubridate

Manipulation avancée des tableaux de données sous R

  • Tri un tableau de données
  • Filtrage des données d’un tableau (lignes et/ou colonnes)
    • Par le biais des noms des éléments
    • Par le biais des indices des éléments
    • Par le biais des opérateurs de comparaison (extraction par condition)
    • Par le biais des opérateurs de comparaison et des opérateurs logiques (extraction par conditions)
  • Extraction aléatoire d’observations d’un tableau
  • Fusion de plusieurs tableaux de données
    • Commandes rbind et cbind
    • Commande merge
  • Commandes stack et unstack
  • Commandes melt et dcast du package reshape2
  • Commandes reshape

Création de tableaux de synthèses

  • Moyennes (et écart-types) par groupe
    • Commande tapply
    • Commande aggregate
  • Synthèse de Normalité de toutes les variables quantitatives
  • Synthèse des résultats des analyses statistiques : tableaux des p-values de toutes les variables…

Utilisation des commandes de type apply

  • Commande apply
  • Commande sapply
  • Commande lapply
  • Utilisation de ces commandes sur des cas concrets
  • Comparaison des commandes lapply et sapply

Création et exécution de scripts élaborés

  • Exécution des scripts : dans la console, à partir d’un autre script
  • Entrées clavier et sorties écran
    • Commande scan(), package svDialogs
    • Commandes cat et print
  • Structure de contrôle
    • Sélection : if, if else, ifelse, switch
    • Boucles : for, while, repeat
    • Commandes break, stop, next
  • Extraire les éléments d’une analyse statistique : p-values d’une ANOVA, résidus d’une régression…

Création et exécution de fonctions utilisateurs

  • Accéder au programme d’une fonction R (pour s’en inspirer, pour la modifier)
  • Expression générale des fonctions
  • Chargement d’une fonction utilisateur en mémoire
  • Appel à une fonction utilisateur
  • Valeur par défaut des arguments d’une fonction
  • Les « … »
  • Création d’une fonction d’automatisation de tâches complexes

Optimisation d’un programme

  • Les erreurs à ne pas commettre
  • Les solutions permettant d’éviter les boucles et les instructions de sélection
  • Vectorisation d’un programme
  • Les bonnes pratiques

Pédagogie

  • Explications théoriques suivies de pratiques guidées puis mises en autonomie
  • 1 vidéoprojecteur par salle
  • 1 ordinateur par stagiaire
  • Exercices de synthèse et d’évaluation
  • Evaluation de fin de stage

Formations de la même catégories (5)

Data Value
Rmarkdown – Rapports automatisés sous RPar Data Value

Produire, de façon automatisée, des documents de travail contenant du texte, du code R, et les sorties de ces codes R, tout en s’inscrivant dans une démarche de travail reproductible. Les documents pourront être générés en format HTML, Word ou PDF.

Micropole Institut
R - ShinyPar Micropole Institut

L'objectif de cette formation est de mettre en place une application complète avec R Shiny.

Orsys
Environnement R, traitement de données et analyse statistiquePar Orsys

R est un environnement logiciel Open Source spécialisé dans le calcul et l'analyse statistique. Ce stage vous présentera ses concepts et ses fonctionnalités. Il vous montrera comment manipuler les données et leur appliquer des modèles statistiques dans le cadre de cet environnement.

Arkesys
Logiciel R / R Studio - Graphiques - Commandes de bases et initiation au package ggplot2Par Arkesys

La formation en quelques mots

Cette formation s'adresse à des personnes souhaitant appréhender la construction et la modification des graphiques sous R. Au cours de la formation, nous utiliserons les fonctionnalités standards de R pour la création des graphiques mais également un package permettant de générer des graphiques plus évolués et esthétiques : ggplot2. Il ne s’agit donc pas d’une formation sur le fond statistique mais bien d’une formation orientée logiciel.

Thèmes principaux

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.

Arkesys
Logiciel R / R Studio - Niveau 1 Outils de BasePar Arkesys

Cette formation s'adresse à des personnes souhaitant prendre en main le logiciel R. Précisons que l’animation s’appuiera sur l’usage de R Studio. Les compétences acquises concerneront :

Il ne s’agit pas d’une formation sur les méthodes statistiques mais bien d’une formation sur le logiciel R. En outre, il ne s’agit pas d’une formation sur les techniques de programmation avancée sous R.
A l'issue de la formation, le stagiaire sera capable de mettre en œuvre des scripts simples sur la manipulation et l'analyse de données peu complexes.

Thèmes principaux

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.

Nous utilisons les cookies afin de fournir les services et fonctionnalités proposés sur notre site et afin d’améliorer l’expérience de nos utilisateurs. En cliquant sur ”J’ai compris”, vous acceptez l’utilisation de ces cookies.