La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l’analyse, l’interprétation de données ainsi que la présentation de ces ressources afin de les rendre compréhensibles de tous.
Ce domaine des mathématiques ne doit pas être confondu avec une statistique qui est un nombre calculé à partir d’observations. Pour un article (plus technique) sur une statistique consultez l’article statistique.
AWStats est un analyseur de log web (mais aussi FTP, Streaming et mail) offrant des vues graphiques statiques mais aussi dynamiques des statistiques d’accès à vos serveurs web.
Il permet d’afficher le nombre de visites, de visiteurs uniques, de pages, de hits, de transfert, par domaine/pays, hôte, heure, navigateur, OS, ... Il peut être lancé grâce à des scripts CGI ou en ligne de commande.
AWStats est un logiciel libre sous licence GPL.
BIRT est un outil opensource de génération de rapport, basé sur Eclipse.
FreeMetrics est une plateforme de gestion des couts (client, analyseur, administration) qui permet à l’utilisateur de gérer un projet en fontcion de métriques telles que l’objectif, les variances, les valeurs minima et maxima.
JasperReports est un outil de Reporting Open Source, offert sous forme d’une bibliothèque qui peut être embarquée dans tous types d’applications Java.
JasperReports se base sur des fichiers XML (dont l’extension est en général .jrxml) pour la présentation des états. Il peut être couplé à iReport (outil WYSIWYG) pour faciliter sa mise en œuvre dans une application Java, classique ou orientée web.
RobotStats est une application gratuite permettant d’analyser les visites des robots sur votre site, développée par Olivier Duffez (WebRankInfo). Pour chaque page de votre site contenant un petit bout de code PHP, RobotStats détecte si le visiteur est un des 180 robots pris en compte par l’application. Si c’est le cas, la visite est enregistrée dans une base de données MySQL.
Webalizer, mot-valise formé à partir de Web et de analyzer, est un logiciel permettant d’analyser l’utilisation des serveurs web en générant, à partir de leurs journaux d’accès (log), des comptes rendus sous forme de pages web. Diffusé sous licence GPL, c’est aujourd’hui un des outils d’administration de serveur web les plus utilisés (2005), en particulier sur les architectures LAMP.
Initié dès 1997 par Bradford L. Barrett, le projet n’est plus maintenu depuis 2001 (dans sa version principale, mais des forks sont apparus).
Les statistiques communément reportées par Webalizer incluent : le nombre de hits et de visites, le pays d’origine des visiteurs, les champs référants (HTTP referers), la quantité de données téléchargées. Ces mesures peuvent être représentées graphiquement, et selon différentes échelles de temps telles que par mois, par jour, ou par heure.
Weka est un outil permettant d’exécuter des algorithmes de data-mining sur un ensemble de données. Il est ainsi possible d’isoler des populations ou d’extraire des règles à partir des données contenues dans le datawarehouse. Weka
Il se présente sous la forme d’une application indépendante, disposant d’une interface utilisateur graphique ou en ligne de commande.
L’utilisateur peut appliquer un à un les différents algorithmes, ou bien créer, d’une façon similaire à Kettle, un workflow de traitements qui pourra par exemple être utilisé dans une plateforme décisionnelle pour analyser périodiquement les données.
L’utilisation de Weka demande de bonnes connaissances du data-mining et des différents algorithmes statistiques utilisés.