Les données secondaires de Deloitte
Comment Deloitte réussit à obtenir des résultats similaires à un audit d'assurance classique en utilisant des données secondaires publiques.
Table des matières
“Your Facebook activity may say as much about you as an analysis of your bodily fluids”.
Deloitte (Hett, 2011)
Ce texte fait partie d’une série de 7 études de cas, pour un dossier spécial sur le Big Data.
Traditionnellement, le processus pour déterminer l’éligibilité des candidats lors de l’inscription à une police d’assurance est assez dispendieux. Une compagnie d’assurance peut, par exemple, faire passer des tests d’urine ou des analyses sanguines, qui doivent être effectués par des experts du milieu médical, afin de mieux comprendre s’il est ou non avantageux d’assurer un candidat et à quel prix. Le coût de l’évaluation d’un candidat est en fait estimé entre 100 $ à 1000 $, selon Deloitte (2010).
La question de comprendre comment faire diminuer ces frais est au centre d’une étude réalisée en 2010 par Deloitte, pour le compte d’Aviva TLC, la sixième entreprise la plus importante mondialement dans le domaine des assurances et basée au Royaume-Uni. Plus précisément, le but de cette étude était de concevoir un modèle d’analyse prédictive qui permettrait à Aviva d’analyser des données traditionnellement destinées au secteur du marketing afin d’en extraire des informations permettant d’évaluer la qualité des demandeurs de polices d’assurance à moindre coût.
Expérimentation et méthodologie
Pour cette étude, les dossiers de 60 000 candidats ont été évalués. Alors qu’Aviva filtre les candidats selon des méthodes traditionnelles pour les catégoriser selon leur degré de risque, Deloitte décide d’utiliser des méthodes d’analyse prédictive, avec l’objectif d’obtenir des résultats similaires à de moindres coûts.
Pour ce faire, elle divise les 60 000 candidats évalués par Aviva en deux groupes de 30 000 candidats. Elle analyse ensuite les données du premier groupe, en excluant celles des rapports médicaux (tests d’urine ou tests sanguins), afin d’en dégager des tendances pour son modèle. Les données utilisées sont, par exemple :
- l’historique médical personnel et familial;
- l’historique des données relatives à d’autres demandes de police d’assurance;
- les antécédents des assurances de véhicules;
- les données marketing relatives aux habitudes de consommation.
Des données secondaires concluantes
C’est à propos de ce dernier point que l’approche de Deloitte est assez originale. Comment extraire des informations utiles au secteur des assurances à partir de données provenant du secteur du marketing ? En fait, environ 37 % du modèle prédictif de Deloitte est basé sur les données secondaires (et publiques) amassées par Equifax Inc. et portant sur les habitudes de vie des futurs assurés, comme leurs passe-temps, émissions de télévision préférées, habitudes de lectures, revenu, etc.
L’approche de Deloitte est concluante. Lorsque le modèle est utilisé pour analyser le deuxième groupe de 30 000 candidats, des résultats similaires à l’audit d’Aviva sont obtenus. Selon John Currier, l’actuaire en chef chez Aviva :
“the use of third-party data was persuasive across the board in all cases” (Johnson, 2011).
Diminuer les coûts avec Facebook
En fait, selon les résultats de l’étude, il pourrait coûter dorénavant entre cinq à dix dollars aux compagnies d’assurances américaines pour évaluer leurs candidats (Deloitte, 2011), c’est-à-dire une baisse extraordinaire des coûts habituels.
Ce qui est intéressant dans ce cas, c’est que les données secondaires utilisées pour cette étude sont disponibles à tout le monde. Tout ce dont on a besoin est d’un peu de budget et une bonne équipe qui arrivera à en dégager les tendances utiles pour atteindre les objectifs. À cet égard, on peut penser que ça ne prendra pas beaucoup de temps avant que les données publiques disponibles sur les réseaux sociaux, tels que Facebook et Twitter, ou bien celles des réseaux sociaux de géolocalisation, comme Foursquare et Gowalla, soient utilisées par les mêmes parties ou d’autres entreprises dans le but de réduire leurs coûts.
“Theoretically online data could be used at an individual level; your Facebook fan pages, online purchases, even the extent of social networking site use could be used directly to assess your life insurance premiums” (Hett).
L’illustration provient de GO direct