En bref...

Afin de proposer les solutions les plus adaptées aux besoins de nos clients, EBSofts intervient sur une large gamme de services couvrant l’intégralité du cycle de vie d’un projet; des études préliminaires jusqu’à son suivi en passant par sa mise en œuvre. Nous intervenons dans trois catégories de projets : intégration solution Open Source, initiative Business Intelligence et développement de solutions d’entreprise.


Intégration Open Source

L'open source est à votre service avec un coût de développement faible, rapidité des processus, modulabilité et logiciels ouverts. Nous vous accompagnons durant l'ensemble de la démarche de choix, d'implémentation et d'exploitation de logiciels libres au sein de votre système d'informations dans les domaines du Business Intelligence et de Big Data. Nous mettons à votre service une prestation à très forte valeur technique et opérationnel.


Notre offre d’intégration Open Source est axée autour de deux pôles majeurs : Business Intelligence et Big Data. Pour la business Intelligence, nous vous apportons notre expertise dans les solutions open source les plus utilisées à savoir Talend et Pentaho. Pour le Big Data, notre catalogue s’articule sur deux besoins fondamentaux du Big Data qui sont les moteurs de recherche et les SGBD NoSQL. Pour le premier, nous pouvons vous accompagner à la mise en place d’Apache Solr et ElasticSearch. Pour la partie SGBD NoSQL, nous disposons de compétences nécessaires pour vous accompagner à intégrer MongoDB ou Cassandra, ou évaluer votre besoin afin de vous conseiller sur le SGBD à mettre en place.


Talend, un logiciel open source d’intégration de données, accessible à tous, et pour tous les besoins d’intégration. Il offre des solutions puissantes et innovantes, utilisées principalement pour l’intégration entre systèmes opérationnels, l’ETL pour le décisionnel ou la migration de données (entre système ou base de données).


Talend permet de gérer les principaux domaines liés aux données de l’entreprise, tels que :

  • Intégration de données
  • Qualité de données
  • Master Data Management
  • Enterprise Service Bus
  • Gestion des Processus métier
  • Intégration Big Data
  • Intégration Cloud


La gestion de ces domaines au travers d'outils simples à utiliser permet aux entreprises de tirer parti des données transitant dans leur système d'information.

L'avantage des solutions Talend résident bien entendu dans leur facilité de prise en main et leur souplesse mais également dans le fait que ces solutions sont intégrées au sein d'une même plateforme. A la différence des vendeurs traditionnels, qui proposent des solutions fermées ne s’intégrant pas les unes aux autres, Talend offre une plateforme Open Source unique et flexible.

Le site officiel de Talend offre plus d'informations sur les fonctionalités de ce dernier.



Pentaho est une suite de logiciel Business Intelligence de l’intégration (ETL) à l'extraction (rapport, dashboard) de données. Pentaho existe en version communautaire (licence LGPL) et commerciale (licence propriétaire).


Pentaho fournit toutes les fonctionnalités requises pour bâtir un système décisionnel :

  • ETL (avec Pentaho Data Integration également connu sous le nom de Kettle)
  • Analyse multidimensionnelle (avec le moteur OLAP Mondrian)
  • Rapport à la demande (Ad Hoc reporting)
  • Rapport classique (avec Pentaho Report Designer ou le plugin BIRT)
  • Dashboard (avec le Dashboard Designer de la version commerciale ou C*TOOLS dans la version communautaire)
  • Datamining (Weka)



Apache Solr est le moteur de recherche open source de référence basée sur Lucene. Il propose des fonctionnalités avancées de recherche plain-texte (full-text), d’indexation, de facette, facilement configurable, rivalisant avec les meilleurs logiciels propriétaires. Solr peut être intégré dans plusieurs cas d’usages tels que le Big Data et les sites d’e-commerce.


Les avantages d’un tel moteur de recherche pour l’indexation et la recherche d’informations sont multiples : aucun frais de licence, évolution verticale ou horizontale relativement simple, multiples modules d’analyse textuelle, interface de recherche de type REST, etc. Bien entendu, ces systèmes n’ont pas été créés pour remplacer les bases de données contenant les données opérationnelles des applications. Les systèmes de recherche textuelle peuvent évoluer en parallèle à un système de gestion de bases de données opérationnelles et permettent de mieux répondre aux besoins spécifiques auxquels ils sont appelés à répondre de façon indépendante. Les concepts de base utilisés dans le moteur de recherche Solr sont similaires à ceux trouvés dans un système de gestion de bases de données relationnelles (SGBDR), mais avec une nomenclature mieux adaptée à la réalité des engins de recherche.

Solr offre les fonctionnalités suivantes :

  • Indexation et recherche en fonction de la langue (découpage des mots, mots-vides, synonymes, élisions, …)
  • Recherche par termes, par expressions, par requêtes booléennes en utilisant des wildcards
  • Tri par pertinence
  • Recherche et filtrage par facettes
  • Recherche géo-spatiale
  • Suggestion de requêtes en cours de frappe (suggester)
  • Correction orthographique (spellcheck)
  • Recherche phonétique
  • Recherche par similarité (more like this search)
  • Statistique percentile
  • Mise en évidence dans les résultats des termes de la requête (highlighting)
  • Indexation de texte brut mais également de documents dans des formats variés (PDF, Office, …)
  • Mise en cluster des résultats
  • Interface d’administration et de monitoring


Pour les performances, Solr propose les fonctionnalités du Cloud et du Sharding. Le Cloud est principalement utilisé pour la haute disponibilité et la tolérance aux pannes/fautes. Une configuration Cloud est aussi intéressante pour distribuer la charge sur plusieurs serveurs Solr. Le Sharding permet de décomposer les données de l’index en plusieurs parties (shard) et de les mettre sur plusieurs serveurs dans le but d’avoir des recherches distribuées sur plusieurs serveurs et ainsi améliorer le temps de réponse.

Solr fournit des API de type Web Service (RESTFull), tant pour l’indexation, la recherche que l’administration (gestion des indexes et monitoring). Des API existent pour différents langages de programmation tels que Java (SolrJ), PHP, Python,...


Comme pour Solr, ElasticSearch se base sur le moteur d’indexation Lucene. Il propose pratiquement les mêmes fonctionnalités que Solr excepte les choix techniques mis en œuvre pour gérer le fonctionnement sous forme de cluster et la communication des nœuds entre eux. Solr s’appuie sur Zookeeper qui a pour rôle de centraliser les configurations et de communiquer l’état du cluster à chaque nœud, alors qu’ElasticSearch est autonome et ne nécessite pas l’utilisation et l’installation d’un outil tiers. C’est souvent ce point précis qui fait dire qu’ElasticSearch est plus simple à mettre en oeuvre que Solr. Cependant, ce qui parait comme un avantage au premier abord peut devenir un inconvénient par la suite lors de problèmes ponctuel de communication entre les nœuds du cluster.

De plus et contrairement à Solr, aucun format de document n’est imposé dans ElasticSearch. Lors de l’ajout d’un document pour l’index, ElasticSearch va détecter la structure de données, indexer ces données et les rendre consultables. Ensuite, suivant les spécificités du domaine d’utilisation, il sera intéressant de structurer fonctionnellement ces documents pour personnaliser la façon dont ces données seront indexées. Après tout, l’un des slogans d’ElasticSearch est : "Your Data, your search".



Les bases NoSQL sont des bases de données issues du monde web et répondant aux problématiques de hautes disponibilités, grandes performances en lecture et/ou écriture ainsi que le traitement de grands volumes de données. Facebook, Twitter, Google, LinkedIn, Amazon sont parmi les têtes d’affiches à utiliser des bases NoSQL au sein de leur architecture afin d’adresser des problématiques différentes (avec des bases différentes). MongoDB fait partie de ces systèmes de gestion de base de données NoSQL. Il est orienté documents, ne nécessitant pas de schéma prédéfini des données (en d'autres termes, des clés peuvent être ajoutées à tout moment "à la volée", sans reconfiguration de la base.). Il est écrit en C++ et distribué sous licence AGPL.

mongoDB se concentre principalement sur 4 principes extrêmement importants aujourd’hui dans le domaine du Big Data:

  • Flexibilité : mongoDB persiste les données sous forme de documents JSON (qui sont sérialisés en BSON). JSON de faire évoluer bien plus simplement le modèle de données qu’avec un système relationnel classique
  • Fonctionnalités et puissance : mongoDB comprend un grand nombre de fonctionnalités existantes dans le domaine des bases de données relationnelles comme les index, les dynamic queries, le tri des résultats, les upserts (update si le document existe, inserts sinon), etc… Cela laisse au développeur la possibilité d’utiliser les « mêmes » fonctionnalités qu’avec un SGBD traditionnel, mais avec la flexibilité et les capacités de scaling qu’un système NoSQL propose
  • Rapidité et scaling : en conservant ensemble les données qui sont en rapport les unes avec les autres dans les documents, les requêtes peuvent être réellement plus rapides que dans un SGBD classique ou ces données seraient séparées dans plusieurs tables et où donc il serait nécessaire de faire une jointure par la suite. MongoDB permet également de rendre scalable très facilement et très rapidement une base de données. Grâce au sharding automatique, on peut augmenter les capacités de la base de données en ajoutant davantage de serveurs
  • Simplicité d’utilisation : mongoDB est très simple d’utilisation, mais également très facile à configurer, à maintenir et à utiliser. Ainsi, mongoDB ne propose que peu d’options de configuration. Ainsi, vous pouvez directement vous lancer dans le développement de vos applications, au lieu de passer énormément de temps à tenter de configurer votre base de données



Cassandra est une base de données NoSQL appartenant à la famille des bases de données orientées colonnes. Cassandra est un projet lancé par Facebook en 2007 qui avait atteint les limites des bases de données relationnelles, c'est pour cela qu'ils ont décidé de créer leur propre base de données répondant à leurs besoins. Après 2 ans de développement, ils ont décidé de l'offrir au monde du libre c'est donc devenu un projet open source appartenant à la fondation Apache en 2009. Il est écrit en Java, mais il existe une panoplie d’API dans pleins de langages.

Cassandra reprend les concepts de 2 bases de données existantes. La première BigTable, créé par Google, pour son modèle de données orienté colonne et son mécanisme de persistance sur disque, et la seconde, Dynamo, créé par Amazon, pour son architecture distribuée sans nœud maître.

Les fondateurs de Cassandra caractérisent ce dernier en 8 points :

  • Il a fait ses preuves : puisque plusieurs compagnies l’ont déjà adopté pour gérer une quantité importante de données telles que Constant Contact, CERN, Comcast, eBay, GitHub, GoDaddy,Hulu, Instagram, Intuit, Netflix, Reddit, The Weather Channel, et plus de 1500 d’autres compagnies. Appel dispose d’un déploiement Cassandra avec plus de 10 PB sur 75000 nœuds
  • Tolérance aux fautes/pannes : les données sont systématiquement répliquées sur plusieurs nœuds. La réplication sur plusieurs Datacenter est aussi possible avec Cassandra. Les nœuds défaillants sont remplacés automatiquement et sans interruption
  • Performant : Cassandra est fondé sur des choix architecturaux qui garantissent une performance linéaire
  • Décentralisée : Il n'y a pas de points de défaillance uniques. Il n'y a pas les goulets d'étranglement du réseau. Chaque nœud du cluster est identique
  • Durable : Cassandra est adapté aux applications qui ne peuvent pas se permettre de perdre des données, même quand un Datacenter entier est endommagé
  • Vous avez le contrôle : vous pouvez choisir entre la réplication synchrone ou asynchrone pour chaque mise à jour
  • Elastique : les performances de lecture/écriture augmentent linéairement à l’ajout de nouveaux nœuds, sans interruption de service
  • Support professionnel : Contrats et services de support sont disponibles auprès de plusieurs partenaires de Cassandra

Business Intelligence

Afin que votre entreprise se différencie positivement de ses concurrents, les systèmes décisionnels doivent être considérés comme un actif à part de votre organisation. Nous vous accompagnons dans la bonne gouvernance de vos systèmes décisionnels en mettant à votre disposition nos compétences métier et technique pour la mise en œuvre de ces solutions. EBSofts propose des services innovants de Business Intelligence afin de vous permettre de collecter et analyser des données internes et externes dans le but de de générer de la valeur au profit de votre entreprise.

Un projet décisionnel comporte tout un ensemble de couches liées les uns aux autres. Chaque couche doit être correctement mis en place et optimisé pour assurer un fonctionnement optimal de votre système décisionnel. EBSofts réunit une connaissance métier et une maîtrise technologique afin de vous accompagner à :

  • Conduire des audits et de la découverte métier (business discovery) afin d’analyser les capacités de vos systèmes décisionnels dans le but de savoir si ces derniers répondent correctement à vos besoins actuels et futures. Ceci vous aidera à avoir des réflexions autour d’une roadmap de l’urbanisation et de la définition de l’architecture décisionnelle adéquate et ce dans un rapport cout/performance
  • Prendre en charge votre projet décisionnel :
    • Conduite de projet
    • Choix technologique des outils (ETL, SGBD, reporting…) et intégration d'outils open source
    • Conception de l'entrepôt de données (Datawarehouse)
    • Définition et réalisation d’indicateurs de pilotage : tableaux de bord et rapports
    • Mise en œuvre de solutions d’analyse et de modélisation multidimensionnelle
    • Mise en place de la gouvernance du décisionnel d’entreprise
  • Prendre en charge la maintenance de votre système décisionnel

Le Big Data constitue un atout majeur dans le domaine décisionnel. Il inscrit la donnée au cœur même de la décision et se décline en multiples usages permettant à l’entreprise d'être plus compétitive : meilleure connaissance du client, accroissement des parts de marché… EBSofts peut vous accompagner dans les projets Big Data, de la réflexion à la mise en place d’outils et processus.

Développement d'application d'entreprise

Nous développons des logiciels métier destinés à vos propres besoins et suivant vos cahiers des charges et spécifications. Nous sommes à l’écoute de toutes les demandes et de tous les projets, quelque soient les domaines d’activité. Nous analysons ensemble votre problématique et nous vous apportons des propositions de solutions adaptées. Pour cela, nous utilisons des technologies de développement de pointes et des méthodologies agiles. Notre expertise s’articule autour des technologies Java/JEE et WEB (HTML5, CSS3, AJAX, jQuery…).

La technologie Java/JEE offre une série d'avantages tels que : la portabilité sur les différent OS, une riche bibliothèque d'interface graphique et une adaptabilité aux divers architectures. Nos équipes comptent plusieurs années d'expertise avec les technologies Java/J2ee, nous mettons notre expérience à votre service pour vous développer vos applications d’entreprise et intervenir sur un ensemble de prestations telles que l’audit, le développement, le test et Migration.

Comme chaque projet a ses propres spécificités, nous adaptons notre démarche selon le contexte du projet et le type de technologies utilisés. Toutefois nous suivons pour l'ensemble de nos projets des principes directeurs communs :

  • Intégrer l'ensemble des dimensions du projet (métier, technique, budgétaire,...)
  • Adopter une démarche pragmatique
  • Garantir un fort niveau d'engagement et de qualité de prestation
  • Capitaliser pleinement sur les expériences et réalisations de nos équipes
  • Attacher une attention particulière à l'adoption par les utilisateurs : ergonomie, facilité,...

Nous développons tous nos projets en suivant une méthodologie agile, garantissant ainsi un suivi et une livraison fiable de tous nos développements.