• Catalogue de données
  •   Rechercher
  •   Carte
  •   S'identifier

SIRENE

Le jeu de données SIRENE contient les établissements d’Île-de-France (environ 2,2 millions) géocodés à l’adresse.


Le Système national d’identification et du répertoire des entreprises et de leurs établissements (SIRENE), est le répertoire français géré par l’Insee qui attribue un numéro SIREN aux entreprises, aux organismes et aux associations et un SIRET aux établissements de ces mêmes entreprises, organismes et associations.


SIRENE a été créé par le décret n°73-314 du 14 mars 1973 et sa gestion a été confiée à l’Insee. Le décret n°83-121 du 17 février 19836 a étendu les données de SIRENE :

- aux personnes morales de droit public soumises au droit commercial (entreprises publiques) ;

- aux personnes morales (ou organismes assimilés comme telles) soumises au droit administratif (comme les institutions et services de l’État, les collectivités territoriales, etc.).


Un arrêté du 13 mai 1987 a modifié le premier décret de 1973. Ces deux décrets et cet arrêté précisent les informations devant figurer dans le répertoire et les conditions d’accès aux informations gérées.

En 1997, le numéro SIREN devient officiellement le numéro unique d’identification des entreprises. Son usage devient obligatoire dans les administrations pour leurs relations avec les entreprises. (Source : Wikipédia).


Du fichier d’origine, n’ont été retenus que les champs réellement utiles. Par ailleurs, pour faciliter l’exploitation, certains champs ont été ajoutés par l’Apur (cf. section des attributs)


Depuis le 1er janvier 2017, la base SIRENE est disponible gratuitement en open data (voir : https://www.sirene.fr/sirene/public/static/open-data).


De début janvier à fin avril 2019, la base SIRENE est accessible à cet emplacement : https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret-fin-le-30-avril-2019/


Le nouveau jeu de données (à partir du 1er juin 2019) est accessible à cet emplacement : https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/

Simple

Information de l'identification

Date (Révision)
2019-01
Etat
Finalisé
Contact pour la ressource
Rôle Organisation Adresse e-mail
Point de contact

Apur

data@apur.org

Propriétaire

Insee

Gestionnaire
Type de représentation spatiale
Vecteur
Type de représentation spatiale
Catégorie ISO
  • Economie

Étendue

Description

Ile-de-France

N
S
E
W


Thèmes de l'Apur
  • Economie, emploi, commerce

GEMET
  • statistiques

  • entreprise

Emprises géographiques
  • Ile-de-France

Contraintes sur la ressource

Limitation d'utilisation

Accès restreint : interne Apur uniquement

Contraintes d'accès
Droit d’auteur / Droit moral (copyright)
Contraintes d'utilisation
Restreint
Autres contraintes

La donnée SIRENE native est accessible et ouverte en licence ouverte ( https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/).

Cette version spécifique a été géocodée par l'Apur et des informations spécifiques pour en faciliter l'exploitation, notamment des effectifs.

Langue
Français
Encodage de caractères
Utf8

Information sur le contenu

Description d’une propriété

Elément abstrait
false

Caractéristiques des attributs

Définition

Localisateur d’adresse utilisé pour géocoder le point

Caractéristiques des attributs

Définition

Statut du géocodage (M=Géocodé,T=Géocodé avec égalité,U=Non-géocodé)

Caractéristiques des attributs

Définition

Coordonnée en x (Lambert 93)

Caractéristiques des attributs

Définition

Coordonnée en y (Lambert 93)

Caractéristiques des attributs

Définition

Code nomenclature NAF de l’établissement niveau 0 (21 postes; cf. fichier de nomenclature en lien)

Caractéristiques des attributs

Définition

Libellé niveau 0

Caractéristiques des attributs

Définition

Code nomenclature NAF de l’établissement niveau 1 (88 postes; cf. fichier de nomenclature en lien)

Caractéristiques des attributs

Définition

Libellé niveau 1

Caractéristiques des attributs

Définition

Code nomenclature NAF de l’établissement niveau 2 (272 postes;cf. fichier de nomenclature en lien)

Caractéristiques des attributs

Définition

Libellé niveau 2

Caractéristiques des attributs

Définition

Code nomenclature NAF de l’établissement niveau 3 (615 postes; cf. fichier de nomenclature en lien)

Caractéristiques des attributs

Définition

Libellé niveau 3

Caractéristiques des attributs

Définition

Code nomenclature NAF de l’établissement niveau 4 (732 postes; cf. fichier de nomenclature en lien)

Caractéristiques des attributs

Définition

Libellé niveau 4

Caractéristiques des attributs

Définition

Établissement pertinent pour l’exploitation d'effectifs salariés

Caractéristiques des attributs

Définition

Effectif salarié estimé de l'établissement (avant redressement)

Caractéristiques des attributs

Définition

Effectif salarié estimé de l’établissement

Caractéristiques des attributs

Définition

Effectif salarié estimé de l’entreprise

Caractéristiques des attributs

Définition

Code INSEE de la commune de l’établissement

Caractéristiques des attributs

Définition

Numéro d’IRIS associé

Caractéristiques des attributs

Définition

Identifiant de l'EPCI

Caractéristiques des attributs

Définition

Libellé de l'EPCI

Informations sur la distribution

Format (encodage)
  • SQL

Ressource en ligne

Protocole

DB:POSTGIS

Nom

sirene_insee

Fonction
Information
Ressource en ligne

Nomenclature NAF complète (0 à 5)

Nomenclature NAF complète (0 à 5)

Ressource en ligne

Description complète du dessin des fichiers stock et mises à jour mensuelles

Description complète du dessin des fichiers stock et mises à jour mensuelles

Généalogie des ressources

Généralités sur la provenance

Contraintes géographiques et topologiques

Nom informatique de l’objet : sirene


Identification informatique : siren + nic

Clé sémantique : La clé sémantique est le numéro de Siret qui correspond à la clé de l’établissement. Cette clé est elle-même composée du « siren » (numéro unique de l’entreprise, sur 9 chiffres) et du « nic » (numéro interne de classement de l’établissement, sur 5 chiffres)


Changement d’identifiant et disparition d’objets:

Changement de l’identifiant : pas de changement de l’identifiant quel que soit le changement de l’un des attributs.

Conservation de l’identifiant : conservation de l’identifiant quel que soit la mise à jour d’un des attributs de l’objet y compris en cas de changement d’adresse.

Disparition de l’identifiant : Il disparaît si l’objet n’existe plus.


Compléments de définition pour certains attributs "Apur" :


Champ nb_effectif : Champ renseignant l’effectif salarié « réel » de l’établissement. Il a été renseigné en croisant les données des deux champs natifs « tefet » et « efetcent », renseignant tous les deux à leur manière sur l’effectif salarié de l’établissement :

- Le champ « tefet » (Tranche EFfectif Etablissement) classe l’établissement selon une quinzaine de tranches d’effectifs (voir domaine ci-dessous)

- Le champ « efetcent » (EFfectif Etablissement par CENTaine) » correspond à des tranches d’effectifs salariés à la centaine près. Plus précis que « tefet », il n’est cependant pas toujours pertinent, car mal renseigné dans certains cas.

La valeur a donc été identifiée à la médiane de chaque tranche « efetcent » lorsque possible (c’est-à-dire lorsque la tranche par centaine est bien renseignée), et à la médiane des tranches type « tefet » dans le cas inverse. Un réajustement a ensuite été effectué manuellement sur les établissements importants (plus de 2000 salariés à l’adresse), afin de détecter d’éventuels effets de siège, ou encore afin de corriger des effectifs sous/surévalués, notamment en croisant SIRENE avec d’autres sources d’informations. Des arbitrages ont été également effectués afin de répartir le plus réalistement possible les employés d’une entreprise donnée dans ses établissements.


Champ nb_effectifent : Effectif total de l’entreprise en sommant les effectifs réels (nb_effectif) de tous les établissements appartenant à la même entreprise.


Champ b_retenu : Le fichier SIRENE a été utilisé notamment afin de cartographier les mouvements de marchandises en Ile-de-France (étude 2016). Les mouvements hebdomadaires induits par chaque établissement sont calculés à l’aide de ratios fournissant un nombre de mouvements par employés en fonction de la classe d’activité de l‘établissement concerné.

Dans ce contexte, certains établissements du fichier SIRENE ne sont pas pertinents, car ils n’induisent pas de mouvements de marchandises, notamment par l'absence d'effectifs salariés. C’est particulièrement le cas des Sociétés Civiles Immobilières (SCI) et autoentrepreneurs (entreprises ne possédant qu’un seul établissement et aucun salarié), dont le nombre a explosé au cours des dix dernières années.

Pour cette raison, le champ « b_retenu » (valeur O/N) a été créé. Sont affectées les valeurs suivantes :

- ‘O’ : l’établissement doit être comptabilisé dans le traitement;

- ‘N’ : l’établissement n’est pas pertinent et ne doit pas être comptabilisé dans les traitements.


Les établissements b_retenu = ‘N’ concernent plus précisément :

- les établissements de code NAF 6820 : « Location ou exploitation de biens immobiliers propres ou loués », possédant 0 salariés. Ils ont été considérés comme des SCI ou des situations d’indivision successorale, en d’autres termes des établissements/entreprises à l’existence purement administrative (et ne générant donc pas de mouvements de marchandises).

- les établissements de 0 salariés dont le champ « siège » = 1 (booléen indiquant si l’établissement est siège de l’entreprise à laquelle il appartient), c’est-à-dire les établissements sièges ne possédant aucun salarié, ont été considérés comme correspondant à des autoentrepreneurs.

Ces deux types d’établissements représentent à eux seuls 75% du fichier SIRENE. Bien que la majeure partie des établissements « parasites » de SIRENE (c’est-à-dire ceux dont l’existence est administrative) aient été enlevés via cette méthode, elle peut être affinée en travaillant par exemple sur les statuts juridiques des entreprises restantes.

Information sur la représentation spatiale

mri:geometricObjectType
Point

Information sur le système de référence

Nom du système de référence
RGF93 Lambert 93 (EPSG:2154)

Date

Métadonnées

Identifiant de la fiche
urn:uuid/urn:apur:sirene

Langue
Français
Encodage de caractères
Utf8
Point de contact des métadonnées
Rôle Organisation Adresse e-mail
Point de contact

Apur

data@apur.org

Lien vers la métadonnée

https://geocatalogue.apur.org/catalogue/srv/fre//metadata/urn:apur:sirene

Informations de date (Révision)
2021-03-19T12:20:15
Informations de date (Création)
2019-06-14T15:18:09

Norme des métadonnées

Titre

ISO 19115:2003/19139

Edition

1.0

 
 

Représentation en mode data clustering

Étendue spatiale

N
S
E
W


Mots clés

GEMET
entreprise statistiques
Thèmes de l'Apur
Economie, emploi, commerce

Ressources associées

Not available


  •   À propos
  •   Github
  •