SIRENE
Le jeu de données SIRENE contient les établissements d’Île-de-France (environ 2,2 millions) géocodés à l’adresse.
Le Système national d’identification et du répertoire des entreprises et de leurs établissements (SIRENE), est le répertoire français géré par l’Insee qui attribue un numéro SIREN aux entreprises, aux organismes et aux associations et un SIRET aux établissements de ces mêmes entreprises, organismes et associations.
SIRENE a été créé par le décret n°73-314 du 14 mars 1973 et sa gestion a été confiée à l’Insee. Le décret n°83-121 du 17 février 19836 a étendu les données de SIRENE :
- aux personnes morales de droit public soumises au droit commercial (entreprises publiques) ;
- aux personnes morales (ou organismes assimilés comme telles) soumises au droit administratif (comme les institutions et services de l’État, les collectivités territoriales, etc.).
Un arrêté du 13 mai 1987 a modifié le premier décret de 1973. Ces deux décrets et cet arrêté précisent les informations devant figurer dans le répertoire et les conditions d’accès aux informations gérées.
En 1997, le numéro SIREN devient officiellement le numéro unique d’identification des entreprises. Son usage devient obligatoire dans les administrations pour leurs relations avec les entreprises. (Source : Wikipédia).
Du fichier d’origine, n’ont été retenus que les champs réellement utiles. Par ailleurs, pour faciliter l’exploitation, certains champs ont été ajoutés par l’Apur (cf. section des attributs)
Depuis le 1er janvier 2017, la base SIRENE est disponible gratuitement en open data (voir : https://www.sirene.fr/sirene/public/static/open-data).
De début janvier à fin avril 2019, la base SIRENE est accessible à cet emplacement : https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret-fin-le-30-avril-2019/
Le nouveau jeu de données (à partir du 1er juin 2019) est accessible à cet emplacement : https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/
Simple
Information de l'identification
- Date (Révision)
- 2019-01
- Etat
- Finalisé
- Contact pour la ressource
-
Rôle Organisation Adresse e-mail Point de contact Apur
Propriétaire Insee
Gestionnaire
- Type de représentation spatiale
- Vecteur
- Type de représentation spatiale
- Catégorie ISO
-
- Economie
Étendue
- Description
-
Ile-de-France
))
- Thèmes de l'Apur
-
-
Economie, emploi, commerce
-
- GEMET
-
-
statistiques
-
entreprise
-
- Emprises géographiques
-
-
Ile-de-France
-
Contraintes sur la ressource
- Limitation d'utilisation
-
Accès restreint : interne Apur uniquement
- Contraintes d'accès
- Droit d’auteur / Droit moral (copyright)
- Contraintes d'utilisation
- Restreint
- Autres contraintes
-
La donnée SIRENE native est accessible et ouverte en licence ouverte ( https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/).
Cette version spécifique a été géocodée par l'Apur et des informations spécifiques pour en faciliter l'exploitation, notamment des effectifs.
- Langue
- Français
- Encodage de caractères
- Utf8
Information sur le contenu
Description d’une propriété
- Elément abstrait
- false
Caractéristiques des attributs
- Définition
-
Localisateur d’adresse utilisé pour géocoder le point
Caractéristiques des attributs
- Définition
-
Statut du géocodage (M=Géocodé,T=Géocodé avec égalité,U=Non-géocodé)
Caractéristiques des attributs
- Définition
-
Coordonnée en x (Lambert 93)
Caractéristiques des attributs
- Définition
-
Coordonnée en y (Lambert 93)
Caractéristiques des attributs
- Définition
-
Code nomenclature NAF de l’établissement niveau 0 (21 postes; cf. fichier de nomenclature en lien)
Caractéristiques des attributs
- Définition
-
Libellé niveau 0
Caractéristiques des attributs
- Définition
-
Code nomenclature NAF de l’établissement niveau 1 (88 postes; cf. fichier de nomenclature en lien)
Caractéristiques des attributs
- Définition
-
Libellé niveau 1
Caractéristiques des attributs
- Définition
-
Code nomenclature NAF de l’établissement niveau 2 (272 postes;cf. fichier de nomenclature en lien)
Caractéristiques des attributs
- Définition
-
Libellé niveau 2
Caractéristiques des attributs
- Définition
-
Code nomenclature NAF de l’établissement niveau 3 (615 postes; cf. fichier de nomenclature en lien)
Caractéristiques des attributs
- Définition
-
Libellé niveau 3
Caractéristiques des attributs
- Définition
-
Code nomenclature NAF de l’établissement niveau 4 (732 postes; cf. fichier de nomenclature en lien)
Caractéristiques des attributs
- Définition
-
Libellé niveau 4
Caractéristiques des attributs
- Définition
-
Établissement pertinent pour l’exploitation d'effectifs salariés
Caractéristiques des attributs
- Définition
-
Effectif salarié estimé de l'établissement (avant redressement)
Caractéristiques des attributs
- Définition
-
Effectif salarié estimé de l’établissement
Caractéristiques des attributs
- Définition
-
Effectif salarié estimé de l’entreprise
Caractéristiques des attributs
- Définition
-
Code INSEE de la commune de l’établissement
Caractéristiques des attributs
- Définition
-
Numéro d’IRIS associé
Caractéristiques des attributs
- Définition
-
Identifiant de l'EPCI
Caractéristiques des attributs
- Définition
-
Libellé de l'EPCI
Informations sur la distribution
- Format (encodage)
-
-
SQL
-
Ressource en ligne
- Protocole
-
DB:POSTGIS
- Nom
-
sirene_insee
- Fonction
- Information
- Ressource en ligne
-
Nomenclature NAF complète (0 à 5)
Nomenclature NAF complète (0 à 5)
- Ressource en ligne
-
Description complète du dessin des fichiers stock et mises à jour mensuelles
Description complète du dessin des fichiers stock et mises à jour mensuelles
Généalogie des ressources
- Généralités sur la provenance
-
Contraintes géographiques et topologiques
Nom informatique de l’objet : sirene
Identification informatique : siren + nic
Clé sémantique : La clé sémantique est le numéro de Siret qui correspond à la clé de l’établissement. Cette clé est elle-même composée du « siren » (numéro unique de l’entreprise, sur 9 chiffres) et du « nic » (numéro interne de classement de l’établissement, sur 5 chiffres)
Changement d’identifiant et disparition d’objets:
Changement de l’identifiant : pas de changement de l’identifiant quel que soit le changement de l’un des attributs.
Conservation de l’identifiant : conservation de l’identifiant quel que soit la mise à jour d’un des attributs de l’objet y compris en cas de changement d’adresse.
Disparition de l’identifiant : Il disparaît si l’objet n’existe plus.
Compléments de définition pour certains attributs "Apur" :
Champ nb_effectif : Champ renseignant l’effectif salarié « réel » de l’établissement. Il a été renseigné en croisant les données des deux champs natifs « tefet » et « efetcent », renseignant tous les deux à leur manière sur l’effectif salarié de l’établissement :
- Le champ « tefet » (Tranche EFfectif Etablissement) classe l’établissement selon une quinzaine de tranches d’effectifs (voir domaine ci-dessous)
- Le champ « efetcent » (EFfectif Etablissement par CENTaine) » correspond à des tranches d’effectifs salariés à la centaine près. Plus précis que « tefet », il n’est cependant pas toujours pertinent, car mal renseigné dans certains cas.
La valeur a donc été identifiée à la médiane de chaque tranche « efetcent » lorsque possible (c’est-à-dire lorsque la tranche par centaine est bien renseignée), et à la médiane des tranches type « tefet » dans le cas inverse. Un réajustement a ensuite été effectué manuellement sur les établissements importants (plus de 2000 salariés à l’adresse), afin de détecter d’éventuels effets de siège, ou encore afin de corriger des effectifs sous/surévalués, notamment en croisant SIRENE avec d’autres sources d’informations. Des arbitrages ont été également effectués afin de répartir le plus réalistement possible les employés d’une entreprise donnée dans ses établissements.
Champ nb_effectifent : Effectif total de l’entreprise en sommant les effectifs réels (nb_effectif) de tous les établissements appartenant à la même entreprise.
Champ b_retenu : Le fichier SIRENE a été utilisé notamment afin de cartographier les mouvements de marchandises en Ile-de-France (étude 2016). Les mouvements hebdomadaires induits par chaque établissement sont calculés à l’aide de ratios fournissant un nombre de mouvements par employés en fonction de la classe d’activité de l‘établissement concerné.
Dans ce contexte, certains établissements du fichier SIRENE ne sont pas pertinents, car ils n’induisent pas de mouvements de marchandises, notamment par l'absence d'effectifs salariés. C’est particulièrement le cas des Sociétés Civiles Immobilières (SCI) et autoentrepreneurs (entreprises ne possédant qu’un seul établissement et aucun salarié), dont le nombre a explosé au cours des dix dernières années.
Pour cette raison, le champ « b_retenu » (valeur O/N) a été créé. Sont affectées les valeurs suivantes :
- ‘O’ : l’établissement doit être comptabilisé dans le traitement;
- ‘N’ : l’établissement n’est pas pertinent et ne doit pas être comptabilisé dans les traitements.
Les établissements b_retenu = ‘N’ concernent plus précisément :
- les établissements de code NAF 6820 : « Location ou exploitation de biens immobiliers propres ou loués », possédant 0 salariés. Ils ont été considérés comme des SCI ou des situations d’indivision successorale, en d’autres termes des établissements/entreprises à l’existence purement administrative (et ne générant donc pas de mouvements de marchandises).
- les établissements de 0 salariés dont le champ « siège » = 1 (booléen indiquant si l’établissement est siège de l’entreprise à laquelle il appartient), c’est-à-dire les établissements sièges ne possédant aucun salarié, ont été considérés comme correspondant à des autoentrepreneurs.
Ces deux types d’établissements représentent à eux seuls 75% du fichier SIRENE. Bien que la majeure partie des établissements « parasites » de SIRENE (c’est-à-dire ceux dont l’existence est administrative) aient été enlevés via cette méthode, elle peut être affinée en travaillant par exemple sur les statuts juridiques des entreprises restantes.
Information sur la représentation spatiale
- mri:geometricObjectType
- Point
Information sur le système de référence
- Nom du système de référence
- RGF93 Lambert 93 (EPSG:2154)
- Date
Métadonnées
- Identifiant de la fiche
- urn:uuid/urn:apur:sirene
- Langue
- Français
- Encodage de caractères
- Utf8
- Point de contact des métadonnées
-
Rôle Organisation Adresse e-mail Point de contact Apur
- Informations de date (Révision)
- 2021-03-19T12:20:15
- Informations de date (Création)
- 2019-06-14T15:18:09
Norme des métadonnées
- Titre
-
ISO 19115:2003/19139
- Edition
-
1.0