Open data et entreprises françaises : ce que dit le registre du commerce en France
Juin07

Open data et entreprises françaises : ce que dit le registre du commerce en France

Dans une démarche d’open data, nous avons analysé les données publiques des entreprises françaises. Une démarche qui en dit long. En 2015, le site de données publiques https://datainfogreffe.fr lancé par Infogreffe a donné accès à la plupart des données des greffes de tribunal de commerce sous divers formats, ouverts et réutilisables. On peut ainsi y trouver les informations de radiation et d’immatriculation des entreprises en France depuis 2012. Nous nous sommes donc prêtés au jeu de l’Open Data en utilisant le logiciel Dataviz Tableau Software, et en compilant les données de radiation et d’immatriculation des entreprises françaises depuis 2013 soit 870 015 lignes Excel. Cela nous permet d’en tirer quelques enseignements, et surtout des tableaux de bord interactifs que n’importe qui peut réutiliser pour effectuer ses propres analyses. L’open data révèle les inégalités entre régions La carte géolocalisée des entreprises immatriculées et radiées montre clairement que ce sont les villes qui attirent les entreprises : Plus précisément en prenant l’exemple d’Angers (chaque point correspond à une entreprise géolocalisée donc il y a plusieurs points pour la même ville, à des quartiers différents) : On notera le dynamisme de la région Provence-Alpes-Côte d’Azur, 8ème région la plus peuplée mais troisième en termes de différentiel radiation – immatriculation d’entreprises. Les régions Pays de la Loire, Centre Val De Loire et Bretagne ne s’en sortent pas trop mal également. A l’inverse, les « Hauts de France », 3ème région la plus peuplée, n’est que 6ème pour les immatriculations d’entreprises. Attention l’échelle a été adaptée pour éviter que l’Ile de France écrase les autres régions : il y a bien plus d’immatriculations d’entreprises que de radiations en IDF. En sélectionnant la région Ile de France, on constate qu’en dehors des activités de conseil et de sociétés holding, c’est clairement le secteur de la restauration notamment rapide et celui du conseil en systèmes et logiciels informatiques qui se sont développés ces trois dernières années. On peut également utiliser le filtre de la timeline pour vérifier les données sur une période prédéfinie. Ainsi sur l’année 2015, le secteur du transport de voyageurs par taxi fait une entrée impressionnante avec 2670 immatriculations ! Quelques regrets sur les données fournies par InfoGreffe : le tiers environ des entreprises radiées en 2014 n’ont pas de région, d’où le gros total « Null » de 47 111 dans la carte des régions. En le sélectionnant, nous pouvons constater une répartition géographique aléatoire donc a priori cela ne remet en pas cause les analyses, mais il est dommage de ne pas y avoir fait attention. Plus gênant, pour la région Alsace, seules les radiations d’entreprises survenues en 2015 sont indiquées. Voici un guide rapide pour exploiter au mieux notre dataviz interactive...

Lire la suite
Le Web russe : terre d’opportunités pour les entreprises françaises ?
Juin09

Le Web russe : terre d’opportunités pour les entreprises françaises ?

Portrait d’un espace digital et numérique méconnu par l’équipe du Russia & CIS Desk de l’ADIT, les consultants spécialisés sur l’espace Russie / CEI. Le Web russe est une mosaïque complexe, à la fois riche et ultradéveloppée. A rebours de l’image généralement véhiculée par les media francophones, le « RuNet » est souvent l’objet de fantasmes et de mythes qui ne font pas honneur à la réalité. Pour lever le voile, l’équipe de Diplomatie Digitale a rencontré le Russia & CIS Desk, l’équipe de consultants russophones de l’ADIT. Portrait d’un internet parallèle mais complémentaire, riche et ultra-connecté. Le Web russe : terra incognita aux spécificités importantes « Le Web russe est très puissant » lâche d’emblée Svetlana, directrice du Russia & CIS Desk, le pôle de consultants russophones de l’ADIT. Puissant en quoi ? Dans sa spécificité culturelle, certainement. A l’image de la Russie, à la croisée de l’Orient et de l’Occident, l’Internet russe tire sa force dans son mélange de cultures. Ce dernier associe ainsi les services classiques occidentaux, comme Google, Facebook ou Twitter, tout en se nourrissant d’outils endémiques. L’ensemble a un nom : « RuNet », contraction de Russie et d’Internet. S’y retrouvent pêle-mêle sites web caractéristiques (les noms de domaine s’écrivent aussi en cyrillique), concurrents de Google ou réseaux sociaux nationaux. Ainsi, Vkontakte ou « VK », l’équivalent du réseau social américain Facebook, est utilisé par plus de 49 millions d’internautes contre 21,4 millions d’utilisateurs pour son aîné. « Les internautes utilisent Vkontakte de façon très différente » explique Ninog, elle-aussi consultante spécialiste du marché russe, fraîchement rentrée de Moscou. « Même si Vkontakte a été créé comme un clone de Facebook (ndlr : le site a copié trait pour trait le design de son homologue américain), les usages ont divergé radicalement. Le droit de la propriété intellectuelle n’est pas aussi sévère en Russie qu’aux Etats-Unis ou en Europe de l’ouest. De sorte que Vkontakte est devenue une plateforme pour le téléchargement ou le streaming, souvent illégal par ailleurs, de vidéos ou de musique ». Une plateforme d’échanges qui n’a pas tardé à irriter les ayant-droits américains qui ont par ailleurs pris des mesures. « Depuis », avoue Ninog, « il semble y avoir moins de contenu étranger et plus de contenu russophone ». Mais Vkontakte n’est pas le seul service spécifiquement russe. Yandex, un concurrent national de Google, est profondément ancré dans l’espace CEI / Russie. « Il s’agit d’une décision pragmatique plutôt que l’expression d’un patriotisme », explique Svetlana. Car Yandex ne se contente pas d’être un simple moteur de recherche. A l’image du géant américain, il a su diversifier ses offres : fournisseur d’e-mail, plateforme d’e-commerce ou encore service de cartographie en ligne à l’image de Google Maps, Yandex est en réalité une solution clef en...

Lire la suite
Les réfugiés climatiques : un sujet passé inapercu sur Twitter
Avr10

Les réfugiés climatiques : un sujet passé inapercu sur Twitter

Sur Twitter, les migrations de réfugiés climatiques sont encore peu évoquées et manquent cruellement de visibilité. Dans notre étude de cas sur la Cop20, nous analysons pourquoi les experts n’arrivent pas à faire porter leur voix sur le sujet et comment les questions de migrations de réfugiés climatiques sont détournées par des groupes activistes. Plus de vingt ans se sont écoulés depuis le discours fracassant de Severn Suzuki, cette jeune fille de 12 ans qui avait réduit au silence les dirigeants du monde lors du Sommet de la Terre à Rio. Depuis cette entrée remarquée, les enjeux climatiques se sont peu à peu imposés dans la sphère médiatique au rythme des publications scientifiques alarmantes sur la dégradation de l’environnement. 1992 est aussi l’année durant laquelle a été créée la Convention-cadre des Nations unies sur les changements climatiques (CCNUCC), à la suite du Sommet de la Terre. Par la suite seront créées les COP (Conférence des parties), communément surnommées conférences pour le climat et dont Paris accueillera la 21è édition en novembre – la COP 21. En amont de la COP 21, notre analyse vise à faire une rétrospective sur la précédente conférence pour le climat, la conférence de Lima ou COP 20, et notamment sur un sujet encore trop peu abordé dans les discussions liées au réchauffement climatique : celui des migrations de réfugiés climatiques.   Notre méthodologie Les migrations climatiques sont les flux des mouvements humains qui sont liés à une catastrophe naturelle. Le terme de réfugiés climatiques ou réfugiés écologiques est généralement utilisé pour décrire les individus qui ont été dans l’obligation de se déplacer. Selon le Norwegian Refugee Council, à l’heure actuelle 22 millions de personnes ont dû quitter leurs foyers en raison de catastrophes naturelles. Un chiffre qui semble être amené à augmenter du fait des activités humaines et de la dégradation du climat. Notre analyse consiste à observer les échanges francophones et anglophones effectués via Twitter sur les migrations de réfugiés climatiques. Il s’agit aussi d’introduire une recherche plus vaste des travaux de recherche d’Emilie Chevalier sur le discours spécifique aux migrations climatiques et aux îles Pacifique, dont l’avenir reste imprécis et fait l’objet de débats. Notre premier objectif a été de comprendre comment les discussions sur les migrations climatiques se sont structurées et quels acteurs ont exercé une forte influence durant la COP 20 et ce dans le but de faire une analyse prospective. Nous avons utilisé la plate-forme d’analyse Visibrain Focus TM afin de nous renseigner sur la façon dont les internautes communiquent sur les migrations de réfugiés climatiques, comme le théorise le courant de recherche des Digital Methods initié par Richards Roger. Le choix de...

Lire la suite
Intelligence économique et Big Data : peut-on parler d’innovation disruptive ?
Mar27

Intelligence économique et Big Data : peut-on parler d’innovation disruptive ?

Intelligence économique et Big Data sont-ils complémentaires ou antagonistes ? La révolution de la data va-t-elle bouleverser le secteur ? Le Big Data est-il disruptif, c’est-à-dire va-t-il provoquer un éclatement des métiers et du secteur de l’Intelligence économique ? Ces questions intéressent les professionnels de l’intelligence économique pour qui le Big Data détient le potentiel pour faire avancer les pratiques actuelles… à condition que les données soient structurées et que l’éthique soit respectée. A l’occasion de l’intervention de Jean-Pierre Vuillerme, Senior VP Management des risques de l’ADIT, pour le colloque “La donnée n’est pas donnée” à l’Ecole Militaire, nous avons décidé de faire le point sur les relations entre Intelligence économique et Big Data. Le Big Data : un phénomène né du Cloud ? Avant même d’évoquer les relations qui existent entre intelligence économique et Big Data, il faut peut-être revenir sur ce que couvre réellement ce terme polysémique (l’école de sciences des données de Berkley a ainsi recensé plus de 40 définitions différentes). Le Big Data se définit généralement comme un ensemble de méga-données qui se caractérise, comme l’intelligence économique, par un triptyque : « high volume, high velocity, high variety » (volume, vitesse, variété). Cette “alliance des 3 V” peut déjà fournir un début de réponse à l’énigme Big Data : il s’agit de la convergence de plusieurs bases de données différentes, avec un volume important et dans un temps relativement court. L’aspect qui nous semble le plus novateur dans cette convergence de méga-données est certainement la variété des données de par (1.) leur nature (vidéo, audio, image, texte), et (2.) leur provenance (Twitter, Youtube, recherche Google, données Exif, données audio). Cette variété de données et des plateformes d’utilisation est le point le plus complexe à traiter techniquement : qu’il s’agisse des réseaux sociaux, des données publiques (open data), de données liées aux objets connectés et de métadonnées (données liées aux fichiers produits comme l’heure, la géolocalisation, etc), on se retrouve avec des extensions de fichiers et une masse de données structurées différemment. En effet, s’il suffisait simplement de tirer parti d’un volume important de données en provenance d’une source unique, il n’y aurait rien de véritablement révolutionnaire dans le Big Data. Il est déjà possible à l’heure actuelle de puiser à l’intérieur d’un gisement de données uniques : c’est ce qu’on appelle le data mining, qui est une technique éprouvée et utilisée depuis longtemps par les professionnels de l’intelligence économique. La spécificité des Big Data tient à ce qu’elles rassemblent plusieurs informations différentes. Vient ensuite « la mise en place de règles de gestion et d’interactions, de segmentation et de personnalisation temps réel sur l’ensemble des canaux existants » (Arnaud Féménia, d’Opal Consulting) qui permet de tirer une réponse...

Lire la suite
Swissleaks : Twitter s’intéresse plus aux personnalités qu’aux paradis fiscaux
Fév26

Swissleaks : Twitter s’intéresse plus aux personnalités qu’aux paradis fiscaux

L’affaire Swissleaks a eu un retentissement surprenant. Mais au-delà de l’écho dans la twittosphère française, la crise a-t-elle eu une influence réelle ?   L’affaire Swissleaks, dévoilée suite à une longue enquête d’un consortium de journalistes internationaux, c’est tout d’abord près de 400 000 tweets échangés dans le monde sur le sujet en 72h après les révélations du Monde et des autres journaux partenaires (comme El Confidential en Espagne) le 8 février à 22h : Après une semaine, le total des tweets échangés collectés via le logiciel de veille Visibrain Focus TM est de 440 126. S’agissant d’une enquête internationale, la distribution par langues est intéressante : ce sont de loin les tweets espagnols (38 % du total) et français (30 %) les plus nombreux, les tweets anglais arrivant en 3ème place avec 18 % du total des tweets – pourtant bien aidés par des journaux indiens tel que l’Indian Express (l’Inde est le 3ème pays de provenance des tweets géo localisés). Pas concernés par la fraude fiscale, les anglais et les américains ? Nous en jugerons plus loin. Les communautés francophones, Gad Elmaleh et Swissleaks Un premier coup d’œil sur le tableau de bord de Visibrain Focus TM permet de tirer quelques rapides conclusions sur les Swissleaks. En France, il y a eu 131 812 tweets publiés entre le 7 et le 15 février sur les Swissleaks. Une lecture rapide des messages les plus diffusés et les termes / hashtags les plus mentionnés donne l’impression que les médias décalés tel que Le Petit Journal et Le Gorafi tirent le mieux leur épingle du jeu. Sans oublier bien entendu Le Monde qui a dévoilé le scoop avec notamment un fond de reprise très importante du cas de Gad Elmaleh : Cette tendance est confirmée par : la cartographie des comptes les plus mentionnés (qui correspond donc au “Top Mention” de Visibrain Focus TM), la taille des nœuds qui représentent les comptes Twitter dépendant ici du nombre de fois qu’ils sont mentionnés (via les liens entre eux). Au passage, un détail intéressant émerge d’une analyse plus détaillée : la communauté de @lemondefr, en vert, n’est pas celle de @gadelmaleh, en bleu clair. Cela indique que les reprises les plus nombreuses de la situation fiscale délicate de Gad Elmaleh ne semblent pas venir des tweets du Monde. En regardant simplement les volumes de tweets échangés, il aurait été facile de croire que @gadelmaleh est principalement mentionné via Le Monde, mais la cartographie nous indique que ce n’est pas le cas. Malgré un tweet très repris pour chacun d’entre eux, les communautés du Gorafi et du Petit Journal sont très éloignées du centre des discussions : leurs messages ne sont repris que par les membres...

Lire la suite
Secteur sensible : deux stratégies digitales passées à la loupe
Fév03

Secteur sensible : deux stratégies digitales passées à la loupe

La transparence des réseaux sociaux effraie parfois les organisations liées à un secteur sensible, soumis à des impératifs de confidentialité. Pourtant, il existe des moyens d’adapter ce caractère très particulier à sa stratégie digitale.   Avant-propos : qu’entendons-nous par stratégie digitale dans un secteur sensible Il convient tout d’abord de définir le périmètre de cet article. Quand nous évoquons une stratégie digitale adaptée aux entreprises/organisations d’un secteur sensible, nous excluons l’utilisation spécifique des réseaux sociaux à des fins de recherche d’information qui aborde les réseaux sociaux en qualité de récepteur (à savoir les pratiques de veille, d’Open Source Intelligence, ou de Social Network Analysis utilisés notamment dans la lutte dans les trafics et les contrefaçons ou l’analyse des réseaux). Ici, nous nous positionnons davantage en tant qu’émetteur (le volet communication et engagement d’une stratégie digitale) : il s’agit de décrire comment un acteur d’un “secteur sensible” peut nouer ou renouer le dialogue avec ses parties prenantes alors même que sa situation lui impose une certaine confidentialité. Les longs discours théoriques ne peuvent convaincre les plus sceptiques, cet article se concentrera sur des exemples concrets issus de la sphère publique avant de les mettre en perspective avec le secteur privé.   Secteur sensible, sujets sensibles ? Qu’est-ce qu’un secteur sensible ? Arriver à une définition exhaustive est finalement assez complexe car le terme est très peu discriminant. Le secteur d’une entreprise peut ne pas être fondamentalement sensible, celle-ci peut néanmoins avoir des sujets sensibles qui touchent à son secteur (exemple : les conditions de travail dans l’industrie du textile ou de la traçabilité dans le secteur alimentaire). Toute entreprise peut ainsi se retrouver dans une situation où sa capacité à s’exprimer est  restreinte par la sensibilité d’un sujet sur son secteur. Pour autant, il existe des entreprises ou des organisations auxquelles s’imposent de fortes contraintes en termes de confidentialité, comme les entreprises du secteur de la Défense, des hautes technologies, mais aussi à des organisations étatiques soumises au secret-défense. Ce nécessaire besoin de confidentialité et de protection de l’information peut parfois jeter une image négative sur ces acteurs ou nourrir les suspicions, ce qui justifie le recours à une stratégie digitale adaptée à ces besoins. Plusieurs acteurs ont ainsi réussi à passer outre leurs contraintes pour réussir à communiquer, améliorer leurs images, combattre une situation de danger ou contrôler leurs communications.   La stratégie digitale de la CIA La CIA a fait une entrée remarquée sur le site de microblogging l’année dernière avec ses tweets décalés et son second degré. Pour un communicant comme pour n’importe quel consultant en intelligence économique, il s’agissait d’un défi de taille… que le service de renseignement a su relever...

Lire la suite