Orsys

Environnement R, manipulations et statistiques élémentaires

Par Orsys

Objectifs

  • Constituer des jeux de données à analyser à partir de multiples sources
  • Manipuler les données pour les transformer à partir de fonctions diverses
  • Tracer des courbes et des graphiques avec R
  • Appliquer plusieurs algorithmes de calcul d'indicateurs statistiques

Rappels

  • L'environnement RStudio.
  • Les types de données dans R, les listes, les DataFrames, les facteurs et les variables ordinales.
  • Les dates et les séries temporelles.

Travaux pratiques
Prise en main des scripts dans l'environnement RStudio.

Importation-exportation et production de données

  • Lire un fichier texte ASCII, Excel, SPSS, Minitab, SAS ou Matlab.
  • Lire des données au clavier et utiliser le copier-coller.
  • Lecture/écriture des fichiers, bases de données.

Travaux pratiques
Lecture/Ecriture des données à partir des fichiers, base de données, DataLake et dans le format R.

Manipulation de données, fonctions

  • Opérations sur les matrices ou les DataFrames.
  • Les fonctions outer, apply, lapply, sapply et mapply.
  • Opérations logiques et relationnelles.
  • Manipulation de chaînes de caractères. Manipulation de dates et d'unités de temps.

Travaux pratiques
Traîter les matrices et DataFrames. Utiliser les fonctions lapply ou sapply pour remplacer les boucles for.

Techniques pour tracer des courbes et des graphiques

  • Les fenêtres graphiques : manipulation, sauvegarde.
  • Les fonctions de tracé de bas niveau.
  • La gestion des couleurs et paramètres graphiques.
  • L'ajout de texte, titres, axes et légendes.
  • Diagrammes en croix, tuyaux d'orgue, empilé ou circulaire. Boîte à moustaches.
  • Graphe de la fonction de répartition empirique. Histogramme en densité à amplitudes de classes égales ou inégales.
  • Polygone des fréquences. Représentations graphiques dans un cadre bivarié.

Travaux pratiques
Mise en œuvre des techniques pour tracer des courbes et des graphiques.

Mathématiques et statistiques élémentaires

  • Structuration des variables suivant leur type.
  • Résumés numériques.
  • Mesures d'association.
  • Notions sur la génération de nombres au hasard et de variable aléatoire.
  • Loi des grands nombres et théorème de la limite centrale.
  • Intervalles de confiance.
  • Tests d'hypothèses usuels. Autres tests d'hypothèses.
  • Analyse de la variance à un facteur, deux facteurs ou à mesures répétées.

Travaux pratiques
Mise en œuvre de l'algorithme de détermination du type d'une variable. L'interprétation d'un intervalle de confiance.

PDF

Imprimer

Envoyer

Envoyer la page à :

Programme

Rappels

  • L'environnement RStudio.
  • Les types de données dans R, les listes, les DataFrames, les facteurs et les variables ordinales.
  • Les dates et les séries temporelles.

Travaux pratiques
Prise en main des scripts dans l'environnement RStudio.

Importation-exportation et production de données

  • Lire un fichier texte ASCII, Excel, SPSS, Minitab, SAS ou Matlab.
  • Lire des données au clavier et utiliser le copier-coller.
  • Lecture/écriture des fichiers, bases de données.

Travaux pratiques
Lecture/Ecriture des données à partir des fichiers, base de données, DataLake et dans le format R.

Manipulation de données, fonctions

  • Opérations sur les matrices ou les DataFrames.
  • Les fonctions outer, apply, lapply, sapply et mapply.
  • Opérations logiques et relationnelles.
  • Manipulation de chaînes de caractères. Manipulation de dates et d'unités de temps.

Travaux pratiques
Traîter les matrices et DataFrames. Utiliser les fonctions lapply ou sapply pour remplacer les boucles for.

Techniques pour tracer des courbes et des graphiques

  • Les fenêtres graphiques : manipulation, sauvegarde.
  • Les fonctions de tracé de bas niveau.
  • La gestion des couleurs et paramètres graphiques.
  • L'ajout de texte, titres, axes et légendes.
  • Diagrammes en croix, tuyaux d'orgue, empilé ou circulaire. Boîte à moustaches.
  • Graphe de la fonction de répartition empirique. Histogramme en densité à amplitudes de classes égales ou inégales.
  • Polygone des fréquences. Représentations graphiques dans un cadre bivarié.

Travaux pratiques
Mise en œuvre des techniques pour tracer des courbes et des graphiques.

Mathématiques et statistiques élémentaires

  • Structuration des variables suivant leur type.
  • Résumés numériques.
  • Mesures d'association.
  • Notions sur la génération de nombres au hasard et de variable aléatoire.
  • Loi des grands nombres et théorème de la limite centrale.
  • Intervalles de confiance.
  • Tests d'hypothèses usuels. Autres tests d'hypothèses.
  • Analyse de la variance à un facteur, deux facteurs ou à mesures répétées.

Travaux pratiques
Mise en œuvre de l'algorithme de détermination du type d'une variable. L'interprétation d'un intervalle de confiance.

Formations de la même catégories (5)

Data Value
Rmarkdown – Rapports automatisés sous RPar Data Value

Produire, de façon automatisée, des documents de travail contenant du texte, du code R, et les sorties de ces codes R, tout en s’inscrivant dans une démarche de travail reproductible. Les documents pourront être générés en format HTML, Word ou PDF.

Micropole Institut
R - ShinyPar Micropole Institut

L'objectif de cette formation est de mettre en place une application complète avec R Shiny.

Orsys
Environnement R, traitement de données et analyse statistiquePar Orsys

R est un environnement logiciel Open Source spécialisé dans le calcul et l'analyse statistique. Ce stage vous présentera ses concepts et ses fonctionnalités. Il vous montrera comment manipuler les données et leur appliquer des modèles statistiques dans le cadre de cet environnement.

Arkesys
Logiciel R / R Studio - Graphiques - Commandes de bases et initiation au package ggplot2Par Arkesys

La formation en quelques mots

Cette formation s'adresse à des personnes souhaitant appréhender la construction et la modification des graphiques sous R. Au cours de la formation, nous utiliserons les fonctionnalités standards de R pour la création des graphiques mais également un package permettant de générer des graphiques plus évolués et esthétiques : ggplot2. Il ne s’agit donc pas d’une formation sur le fond statistique mais bien d’une formation orientée logiciel.

Thèmes principaux

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.

Arkesys
Logiciel R / R Studio - Niveau 1 Outils de BasePar Arkesys

Cette formation s'adresse à des personnes souhaitant prendre en main le logiciel R. Précisons que l’animation s’appuiera sur l’usage de R Studio. Les compétences acquises concerneront :

Il ne s’agit pas d’une formation sur les méthodes statistiques mais bien d’une formation sur le logiciel R. En outre, il ne s’agit pas d’une formation sur les techniques de programmation avancée sous R.
A l'issue de la formation, le stagiaire sera capable de mettre en œuvre des scripts simples sur la manipulation et l'analyse de données peu complexes.

Thèmes principaux

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.