MA3008 - Statistiques

MA3008 - Statistiques

Objectifs

Objectif général :

Quand on parle de "statistiques", on désigne généralement un ensemble de données observées sur un phénomène aléatoire. Ces données peuvent provenir de domaines très divers, par exemple de l'économie (études de marchés, prévisions économétriques), de la médecine (expérimentation de nouveaux traitements, imagerie médicale), ou encore de l'ingénierie (contrôle de qualité, signal radar). La "Statistique" désigne quant à elle l'ensemble des méthodes scientifiques qui décrivent la façon d'obtenir ces données (planification d'expériences, sondage), de les traiter (statistique descriptive, analyse des données) et d'interpréter l'information qu'elles fournissent (statistique inférentielle). Dans le contexte actuel du "Big Data", le traitement et l'analyse d'une grande masse d'information est devenu un enjeu majeur dans la plupart des disciplines de l'ingénieur avec des techniques telles que les techniques d'apprentissage automatisé et d'extraction de données (reconnaissance de formes, traitement d'image, système expert, fouille de données, réseaux neuronaux, ...).

Dans la plupart des cas, les données recueillies sont entachées d'incertitude; il y a donc intervention du hasard et des probabilités, et les méthodes employées reposent pour une part sur une modélisation probabiliste de l'information qu'elles traitent.
Avec le développement de la théorie des probabilités au début du XXème siècle, puis celui de l'informatique, la Statistique a connu un véritable essor. La statistique inférentielle procède selon une approche qui s'apparente à la démarche inductive : elle permet d'extrapoler les résultats statistiques observés sur un échantillon à l'ensemble de la population.
"Apprendre en observant" pourrait ainsi résumer la démarche statistique qui sera donc de reconstruire le modèle probabiliste inconnu dans la population à partir des observations. On distingue trois types de méthodes en statistique inférentielle : l'estimation qui permet de donner une approximation des paramètres inconnus d'un modèle probabiliste, les tests d'hypothèses (ou problème de décision) qui ont pour but d'invalider ou non une hypothèse faite sur le modèle et enfin les méthodes de prédiction.

Ce cours est une introduction à la statistique inférentielle, en particulier aux problèmes d'estimation de paramètres, aux tests d'hypothèses et à la régression linéaire.

A l'issue de ce cours, l'étudiant sera capable d'utiliser ces outils statistiques et de les appliquer à un problème concret dans le cadre d'un bureau d'étude.

Objectifs détaillés :

A l'issue du cours, l'étudiant sera capable de
- définir un modèle statistique à partir d'un problème concret;
- proposer une méthode d'estimation de paramètres et étudier ses propriétés;
- construire un intervalle de confiance;
- résoudre un problème de décision en réalisant des tests d'hypothèses;
- modéliser et étudier une relation linéaire entre des variables observées et des variables explicatives;
- utiliser le logiciel R pour effectuer une analyse statistique et rédiger un rapport.

En bref

Crédits ECTS : Cf UE

Contact(s)

Ludovic D'ESTAMPES

Tél : 05.62.25.95.37

Email : ludovic.destampes @ enac.fr

Lieu(x)

  • Toulouse