Panorama des bases de données

accessibles aux organismes HLM
Méthodologie

Afin de créer ce Panorama nous nous sommes basés sur une méthodologie de collecte et d'analyse afin d'identifier les bases les plus pertinentes puis évaluer le niveau de détail qui serait le plus à même de vous donner des éléments utiles dans votre pratique quotidienne.

1- La phase de collecte

Notre travail a commencé par un recensement des bases existantes. Pour cela nous nous sommes appuyé sur notre expérience et en particulier celle de la Direction des Etudes de l'USH. Nous avons ensuite interrogé des Associations Régionales, et des bailleurs.

Ce travail nous a amener à identifier 56 bases de données autour du logement.

2- La phase d'analyse

Afin de rendre la navigation plus simple entre les bases, nous avons décidé de les classer par thématiques.

Les thématiques retenues ont été :

  • Les organismes et leur parc - le parc social, les bailleurs
  • Demandes, besoins et occupations - le peuplement, les demandes, les besoins de logement
  • Economie du logement - coût de production, financement, marché immobilier ..
  • Données de contextualisation - Parc privé, contexte socio-économique etc.

Puis pour chaque base nous avons identifié une trentaine d'informations que nous nous sommes efforcés de collecter. Ces informations sont celles que vous retrouvez sur chaque fiche, réparties en catégories :

  • Identification - éditeur, nom de la base, type de base
  • Thématique - de quoi traite la base
  • Méthodologie d'élaboration - comment est constituée la base, comment est organisée la collecte
  • Périodicité - un ensemble d'élément pour évaluer si la base est active et "vivante"
  • Publication - comment est publiée la base et comment on peut y accéder
  • Données - quelques information sur les données principales
  • Et liens - liens contextuel pour accéder à la base, à la documentation
3- Les analyses poussées

A partir de ce catalogue nous avons sélectionné un nombre réduit de bases (8 au total) sur lesquels nous avons décider de pousser notre analyse.

Pour faire ce choix nous avons "noté" les bases en fonctions de critères qui nous semblaient les plus importants : est-ce que la base est ouverte ? est-elle régulièrement mise à jour ? est-ce que son format rend son usage simple et efficace ? est-ce que les données sont complètes et bien renseignées ?

Ce filtre nous a fait choisir 8 bases qui bénéficient d'une fiche enrichie d'un document allant plus loin dans l'analyse, jusqu'à fournir ce qui nous semble la base sur laquelle un data analyste pourra commencer à travailler. Nous avons ainsi sélectionné :

  • CAF DATA pour des informations sur les allocations familiales
  • Open data Caisse des Dépôts - ensemble de 54 bases très pertinentes
  • La base des Valeurs Foncières
  • La base issue de l'enquête sur la commercialisation de logement neuf (ECLN)
  • La base des indicateurs de loyers d'annonces éditée par la DGALN

Et, naturellement, SITADEL, RPLS et SNE qui sont des passages obligés dans notre secteur

Voici en résumé la méthodologie employée, qui a donné le Panorama que vous parcourez actuellement. Chaque étape a donné lieu à des choix, parfois difficiles, et des arbitrages. L'ensemble est cohérent et nous espérons qu'il pourra être utile pour vous, mais naturellement ce travail n'est pas terminé et méritera d'être enrichi. N'hésitez donc pas à participer pour faire évoluer ce panorama, et peut-être un jour se transformera-t-il lui-même en une base méritant d'être étudiée ? 

Nous remercions

Cette étude a été réalisée pour l'USH avec nos partenaires Espacité et Scan datamining que nous remercions pour la qualité de leur travail

ESPACITESCANDATAMINING