Modélisation prédictive

Wiki

(Définition communautaire : Wikipédia)

L'analyse (ou logique) prédictive englobe une variété de techniques issues des statistiques, dont l’objectif est d’associer une probabilité à un évènement futur. Le calcul de cette probabilité étant fondé sur l’observation du passé et toutes les données passées caractérisant le comportement à prédire. Par exemple, prédire le passage à l’acte pour l’achat d’un produit, correspond à l’analyse des données en provenance des tickets de caisse, des informations des cartes de fidélités, du comportement des internautes, voire des réactions sur Facebook et Twitter... Les méthodes statistiques utilisées seront les régressions (linéaire, logistique….), l’analyse discriminante, les arbres de décision, les réseaux de neurones... En fonction de la nature de ces variables explicatives et de leur relation avec le phénomène à expliquer .

 

 

 

Point de vue d'expert

La modélisation prédictive : tout sauf de la magie ! 

L’apport de ce type d’approche fait rêver beaucoup de décideurs : pouvoir comprendre et anticiper les comportements (d’un client, d’une entreprise, d’un matériel…) avant qu’ils ne surviennent, afin de mettre en place des pistes d’amélioration ou des actions correctrices, peut sembler directement sorti des cerveaux les plus farfelus amateurs de science-fiction.
Pourtant, ces méthodes sont parfois anciennes (plusieurs dizaines d’années) et reposent en toute simplicité sur l’analyse des données réelles à disposition.
Dans tous les domaines, les bénéfices métier sont aisés à comprendre :

sont autant d’applications concrètes.

Simplicité et réactivité

Longtemps considérée comme complexe et à la portée de quelques érudits, la modélisation prédictive est aujourd’hui très simple d’accès : en quelques clics de souris, un utilisateur peut construire et appliquer son premier modèle de prédiction.
L’approche réclame surtout des données, lesquelles ne manquent pas en général.
En effet, ces informations sur des caractéristiques client, des transactions réalisées entre comptes ou issues de capteurs de machines, sont collectées, stockées mais rarement analysées sous l’angle prédictif.
Le rôle du modèle prédictif permet non seulement de comprendre un phénomène mais surtout de retenir les données pertinentes noyées dans une masse d’information.
Les dernières nouveautés en matière de modélisation prédictive accélèrent cette démarche, en brassant des milliards d’information (Big Data), le tout en quelques secondes.
Comme évoqué le mois dernier, vous pouvez mélanger des données structurées et non structurées dans la même démarche prédictive.
L’expert métier en charge de ces analyses voit ainsi sa réactivité décuplée pour traiter de nombreuses questions opérationnelles.

L’approche en quelques mots

Rien de bien sorcier !
La démarche consiste à prédire l’apparition d’un évènement (variable à expliquer) par rapport à des prédicteurs (appelés variables explicatives).
Les algorithmes utilisés sont nombreux et dépendent des distributions des données : lesquels couvrent les modèles paramétriques (régression linéaire, analyse discriminante…) et les modèles non-paramétriques (arbres de décision, réseaux de neurones, plus proches voisins…).

La question suivante est de retenir le meilleur modèle dans la situation donnée. Toutes ces méthodes se manipulent et se comparent de façon intuitive avec une souris. Les graphiques et les statistiques d’aide à la décision sont d’ailleurs produits automatiquement.
La meilleure méthode est également proposée par défaut : l’expert métier se concentre alors sur la traduction opérationnelle de ses travaux.

Accompagnement

INBOX

Analyse textuelle, médias sociaux et marketing – les enseignements d’une expérience pilote

Par Stéphane Amarsy, Directeur Général d’Inbox

Les techniques d’analyse textuelle ne sont pas nouvelles, mais l’avènement des médias sociaux les a rendues incontournables. Désormais les entreprises voient plus concrètement à quoi le text mining peut leur servir, et les applications potentielles semblent infinies dans un contexte de « Big Data ». Pour autant, avant de faire miroiter un « eldorado des données non-structurées », il me semble essentiel de revenir à quelques considérations de bon sens.

L’analyse textuelle pour être à l’écoute des médias sociaux

Quand les blogs et autres médias sociaux sont apparus, le buzz a été tel que les entreprises se sont précipitées : il fallait y être, ouvrir sa page facebook ou son compte twitter. Pour quoi faire ? On verrait bien. Avec le recul, on peut voir que les entreprises et les marques ont toutes considéré le sujet comme relevant de la seule communication. On y fait de la publicité, on y calcule son e-réputation (avec l’analyse textuelle), on y fait de la publicité… Mais en réalité, les membres des réseaux sociaux ne sont pas une audience. Ils sont actifs, émettent autant de messages qu’ils en reçoivent, et n’hésitent pas à poster leurs doléances sur le compte facebook d’une marque en délaissant les canaux classiques du service client.
Dès lors, il serait plus pertinent de considérer les médias sociaux comme un canal supplémentaire dans la relation client, et appliquer des raisonnements de type marketing, en observant et en cherchant à comprendre avant d’agir. C’est la base du CRM – et c’est là que l’analyse textuelle peu s’avérer pleinement utile.

Lire la suite de l'article

Côté enseignement

Master ESA | Paris 13

L'Université d'Orléans présente le Master ESA (Econométrie et Statistique Appliquée)

Créé en 2004 à l’initiative d’enseignants-chercheurs de l’Université d’Orléans et avec le soutien de SAS Institute France, le Master ESA a pour objectif de former des étudiants aux métiers de l’analyse économique quantitative et de l’aide à la décision.

En deux ans, cette mention propose d’acquérir des compétences reconnues tant dans le monde professionnel que dans le cadre de la préparation d’un doctorat d’économie appliquée.

Les connaissances transmises s’appliquent à de nombreux secteurs d’activité : la finance, l’analyse économique et conjoncturelle, la santé, l’industrie, la gestion de la qualité, le marketing...

Une fois le Master complété, les étudiants sont qualifiés pour exercer les métiers de chargé d’études statistiques, chargé d’études actuarielles, ingénieur en statistique et géo-statistique, chargé d’études marketing, et ingénieur en informatique décisionnelle.Lire la suite de l'article

 

L'Institut Galilée de l’Université Paris 13 – Sorbonne Paris Cité présente le Master EID2 (Exploration Informatique des Données et Décisionnel)

La quantité de données collectées chaque jour devient de plus en plus importante et engendre des masses de données. Ces données, qui pourtant représentent un extraordinaire gisement d’informations, sont généralement rejetées par saturation. Pour cela, dans de nombreuses applications, il devient crucial de mettre en place de nouveaux outils d’exploration des données permettant une meilleure compréhension de la valeur des connaissances disponibles dans ces données.

C’est dans ce contexte que la spécialité « Exploration Informatique des Données et Décisionnel » (EID²) du Master d’Informatique de Paris 13 a été créée. Fruit d’une réflexion conjointe entre universitaires et industriels, le master EID² se propose de donner à des personnes possédant une bonne formation de base en informatique, une formation complémentaire de haut niveau, spécialisée dans le domaine de l’extraction de connaissances à partir de données. Le master EID² a pour vocation de doter les étudiants d’un large spectre de compétences en les formant aux techniques de pointe de l’intelligence artificielle, de l’algorithmique et de l’exploration des données. L’acquisition de ces compétences suit une démarche scientifique, en s’appuyant notamment sur la recherche.Lire la suite de l'article

 

Comment la représentation visuelle des données a permis de sauver un grand nombre de vies ou histoire de la statisticienne Florence Nightingale

Angleterre, guerre de Crimée. Dans les années 1850, Florence Nightingale, infirmière dévouée et statisticienne passionnée, a joué un rôle majeur dans la baisse du taux de mortalité dans les hôpitaux militaires anglais, plus de deux fois supérieur à celui des patients civils.
Découvrez comment, après avoir mis en place un système de collecte des données médicales, puis procédé à leur analyse, elle a imaginé les toutes premières représentations visuelles des données afin de convaincre la reine Victoria sur les réformes à mener.Voir le blog

 

 

La parole à l'utilisateur

Chico's FAS

« Etre réactif hors de nos boutiques comme à l'intérieur »

Chico's FAS, spécialiste du prêt-à-porter féminin haut de gamme aux Etats-Unis, a su redresser sa situation après 2008 en investissant dans la connaissance client. La crise financière de 2008 a été le déclencheur de sa plongée dans le monde de l'analytique. Mieux connaître pour mieux comprendre, mieux comprendre pour anticiper ! Maintenant armé pour dominer les comportements d'achat à l'aide de l'analytique, Chico's intègre naturellement les nouvelles technologies à sa stratégie de croissance. De l'analyse prédictive à la l'utilisation de l'information des medias sociaux, quand la connaissance et l'information sauvent une société !

Lire la suite

la promotion des métiers et formations de la statistique

SFDS

La promotion des métiers et formations de la statistique est l’une des missions de la SFdS, comme l’illustrent deux actions récentes, la réalisation d’un zoom sur les métiers de la Statistique avec l’Onisep et la co-organisation du Forum Emploi Maths (FEM).
                                                                                                                                           
En partenariat avec l'Onisep, la SFdS a conçu et réalisé, dans la collection "Zoom métiers", une brochure sur les métiers de la statistique et les formations y conduisant au travers de 20 portraits de statisticiens. Téléchargeable librement, la brochure a en outre été complétée par un site présentant en ligne de très courtes vidéos témoignages de statisticiens ainsi que quatre vidéos thématiques sur les métiers du marketing, du secteur banque-finance-assurance, des domaines médical et pharmaceutique et de ceux de l’environnement et l’industrie. Depuis sa sortie en septembre 2011, le zoom a été diffusé à plus de 10 000 exemplaires dans les lycées, près de 6 000 auprès d’étudiants, et a été intensément téléchargé. Très utile, bien sûr, pour présenter les métiers aux plus jeunes, il l’est aussi auprès d’étudiants et de collègues. Cette variété des usages du zoom a été soulignée lors de la rencontre du 21 mars 2012 à Paris.
Un clin d’œil, en guise de transition entre les deux parties de ce billet : lors de la première édition du Forum Emploi Maths (FEM), Cédric Villani, médaille Fields 2010, a brandi le « zoom sur les métiers de la Statistique ».

Avec la SMAI, la SMF et la SIF, ses sociétés sœurs de mathématiques et d’informatique, la SFdS prépare une nouvelle brochure sur les métiers des l’informatique, des mathématiques et de la statistique.

Depuis sa première édition en janvier 2012, le Forum FEM réunit chaque année  près de 1500 étudiants et plus de 80 entreprises et laboratoires. Destiné aux (futurs) diplômés de niveau Master ou doctorat, il leur permet de rencontrer le monde de l'entreprise et une centaine d'employeurs potentiels (entreprises, laboratoires, organismes), proposant emplois, stages, bourses ou contrats divers. Le FEM illustre la réalité, la variété et l’intérêt des métiers suite à une formation en mathématiques.
Ce forum ouvert à toutes les formations au niveau national, permet aux employeurs de mieux définir leurs propositions et d'améliorer le succès des contacts ainsi établis.
Le forum offre également de nombreuses sessions d'information et des témoignages variés, notamment de jeunes diplômés insérés dans la vie professionnelle, et d’expériences de thèses en entreprise, en particulier sur le modèle des témoignages du zoom sur les métiers de la statistique.

Nous vous invitons à utiliser le zoom, à vous associer à la prochaine édition du FEM et à contribuer ainsi à la veille sur les métiers de la statistique.

Retour en haut