|
| Retour au Début de la Page |
STATISTICA Neural Networks est un programme analytique complet, performant, puissant, et extrêmement rapide de réseaux de neurones, offrant :
Comment aborder les Problèmes en Calcul Neuronal
L'utilisation des Réseaux de Neurones va bien au-delà de la simple introduction de données dans le Réseau Neuronal.

STATISTICA Neural Networks va vous guider au fil des étapes clé de la conception du réseau, non seulement pour l'Architecture des Réseaux et les Algorithmes d'Entraînement, mais aussi pour les nouvelles approches innovantes de Sélection des Paramètres d'Entrée et de Conception du Réseau. En outre, les développeurs de logiciels et les utilisateurs travaillant avec des applications sur-mesure apprécieront, une fois leurs expériences prototypes réalisées à l'aide de l'interface simple et intuitive de STATISTICA Réseaux Neuronaux, de pouvoir intégrer la technologie Neurale dans leur propre application (via API), simplement et à moindre coût.
STATISTICA Neural Networks stocke ses données au format STATISTICA ; de cette manière, vos données peuvent aisément être transférées depuis ou vers STATISTICA en utilisant l'une des nombreuses options d'importation de STATISTICA. Vous pouvez également créer vos fichiers de données dans STATISTICA Neural Networks en les saisissant directement dans l'éditeur, en les collant depuis le Presse-papiers, ou en les important à partir de fichiers ASCII (texte) (les délimitations par Tabulations ou virgules sont reconnues). STATISTICA Neural Networks identifie automatiquement les valeurs des variables ainsi que les valeurs manquantes lors de l'Importation. Une fois que vos données sont dans STATISTICA Réseaux Neuronaux, vous pouvez aisément les modifier dans l'Editeur de Données, en utilisant la même interface que celle des feuilles de données ; vous pouvez étiqueter les observations et les variables, ajouter et supprimer des observations et/ou variables, identifier les variables d'entrée et de sortie, répartir les observations en Ensembles d'Entraînement, de Validation et de Test. Vous avez également la possibilité d'exclure temporairement et sélectivement certaines observations et/ou variables.
Sélection des Données d'Entrée et Réduction de Dimensionalité
Une fois que votre fichier de données est prêt, il vous faut sélectionner les variables à utiliser dans le réseau neuronal. Plus vous retiendrez de variables en entrée, plus votre Réseau Neuronal sera gros ; en conséquence, vous aurez besoin d'espace de stockage et de temps d'entraînement plus importants, avec davantage d'observations. Le manque de données et les corrélations entre variables font de la sélection des variables pertinentes et de la concentration de l'information dans un nombre restreint de variables, un problème crucial dans la plupart des applications neurales.
Algorithme de Sélection Neuro-Génétique en Entrée. L'algorithme de Sélection Neuro-Génétique en Entrée de STATISTICA Neural Networks combine les
![[Network Example]](gifs/network2.gif)
techniques des Algorithmes Génétiques et celles des algorithmes PNN/GRNN (PNN est l'abréviation de Probabilistic Neural Networks, et GRNN, celle de Generalized Regression Neural Network) afin de rechercher automatiquement les combinaisons optimales de variables en entrée, même en présence de corrélations et interdépendances non-linéaires. Le traitement quasi-instantané de PNN/GRNN permet à l'algorithme de Sélection Neuro-Génétique en Entrée d'opérer - mais également, par la possibilité que vous avez de supprimer simplement des variables dans l'Editeur de Données de STATISTICA Neural Networks, de mener vos propres expérimentations avec différentes données d'entrée dans un laps de temps raisonnable. STATISTICA Réseaux Neuronaux contient également un programme d'Analyse en Composantes Principales (ACP et Réseaux Auto-Associatifs pour "ACP non-linéaires") permettant d'extraire un nombre réduit de dimensions à partir des données brutes. Notez que vous disposez de divers outils statistiques pour réduire vos données dans STATISTICA.
Préparation de Variables Nominales et Norme des Données
Les données d'entrée dans un réseau doivent être préparées avec soin ; et les résultats, interprétés convenablement. STATISTICA Neural Networks vous offre une norme automatique des données (y compris les échelles Minimax et Moyenne/Ecart-Type) à la fois pour les entrées et les sorties, ainsi qu'une recodification automatique des variables à valeur nominale (par exemple, Sexe={Homme,Femme}), y compris des codifications fractionnaires (un-sur-N). STATISTICA Neural Networks offre des options pour traiter les valeurs manquantes. Des fonctions de normalisation comme Somme Unitaire, Winner-takes-all et Vecteur Unitaire sont également disponibles. Des fonctions spécifiques de préparation des données et d'interprétation permettent une utilisation efficace avec les Séries Chronologiques. De nombreux outils sont également proposés dans STATISTICA.
Pour les problèmes de Classification, vous pouvez définir des limites de confiance que STATISTICA Neural Networks utilisera pour affecter les observations aux classes. Avec la fonction d'activation spécialisée Softmax et les fonctions d'erreur d'Entropie-croisée de STATISTICA Réseaux Neuronaux, une approche probabiliste est également possible pour les classifications.
| Retour au Début de la Page |
Sélection d'un Modèle Neuronal
L'étendue des modèles de réseaux de neurones et le nombre de paramètres à spécifier (comme la taille du réseau ou les paramètres de contrôle de l'algorithme d'entraînement) peuvent parfois sembler déroutants. STATISTICA Neural Networks vous propose les Réseaux de Neurones les plus importants pour résoudre vos problèmes concrets, en particulier :
![[Network Example]](gifs/network1.gif)
STATISTICA Neural Networks vous offre de nombreuses fonctionnalités pour vous aider à sélectionner l'architecture appropriée du réseau. Les résultats statistiques et graphiques produits par STATISTICA Réseaux Neuronaux sont automatiquement calculés, et se présentent sous forme de Cartes en Barres, Matrices et Graphiques des erreurs d'observations individuelles et globales, de synthèse des performances de classifications/mauvaises classifications, ainsi que de diverses statistiques indispensables comme les Ratios d'Erreur de Régression.

Pour visualiser les données, STATISTICA Neural Networks vous propose des représentations graphiques sous forme de Nuages de Points et Surfaces de Réponse en 3D, afin de permettre à l'utilisateur de mieux comprendre le "comportement" du réseau.
Naturellement, vous pouvez exporter toutes les informations issues de ces sources vers un Fichier ou vers le Presse-papiers, ou même directement vers STATISTICA pour les inclure dans vos comptes-rendus, poursuivre votre analyse, ou la personnaliser.
STATISTICA Neural Networks conserve automatiquement une copie du meilleur réseau rencontré en mémoire lorsque vous réalisez une expérience et cette copie est accessible à tout moment. Vous pouvez tester automatiquement le pouvoir explicatif et la validité prédictive d'un réseau en introduisant des observations de vérification, et évaluer la taille et l'efficacité du réseau ainsi que le coût de mauvais classement. Les procédures automatiques de Validation Croisée et de Régularisation des Poids de Weigend proposées dans STATISTICA Neural Networks permettent également à l'utilisateur de tester rapidement si un réseau est trop, ou au contraire, pas assez complexe pour le problème à traiter.
Pour de meilleures performances, STATISTICA Neural Networks vous offre de nombreuses options de personnalisation du réseau. Vous pouvez ainsi spécifier des couches de sortie Linéaires pour des réseaux utilisés dans une approche de Régression, ou des fonctions d'Activation Softmax pour des estimations-probabilités dans le cadre de problèmes de Classification. Si vos données sont largement affectées par les points aberrants, vous avez la possibilité de remplacer la fonction standard d'Erreur qui est utilisée pour l'entraînement par la fonction d'Erreur moins sensible du City-Block. Des fonctions d'erreur d'Entropie-Croisée, basées sur les modèles issus de la Théorie de l'Information, sont également proposées, ainsi qu'une large gamme de fonctions d'activation spécialisées, notamment les fonctions Pas, Pente et Sinus.
L'Assistant Réseau (un Assistant vous aide au cours du processus de création du réseau)
Un Assistant Réseau (accessible par un bouton de la barre d'outils) est accessible dans STATISTICA Réseaux Neuronaux pour guider l'utilisateur dans le processus de création du réseau.
L'Assistant peut créer des réseaux en utilisant des données dont les observations sont indépendantes (réseaux standard) ou des réseaux qui prévoient l'appartenance des futures observations sur la base des cas observés sur la même variable (réseaux chronologiques).
Chacune des boîtes de dialogue de l'Assistant vous demande des informations générales sur le fichier de données et/ou le réseau, explique les choix possibles et propose des valeurs par défaut. Une fois ces informations collectées, STATISTICA Neural Networks va automatiquement afficher tous les résultats spécifiés.
Générateur Automatique de Réseau (Economiseur basé sur l'Intelligence Artificielle)
![[Network Example]](gifs/network3.gif)
STATISTICA Neural Networks contient également un Générateur Automatique de Réseau, qui utilise d'ingénieuses techniques d'optimisation non-linéaire (y compris Recuit Simulé) destinées à trouver automatiquement l'architecture optimale du réseau. Une bonne partie du temps nécessaire à la conception d'un réseau neuronal consiste à sélectionner les variables pertinentes, puis à optimiser l'architecture du réseau par recherche heuristique. STATISTICA Neural Networks vous permet de gagner du temps, et d'économiser vos efforts en menant automatiquement une recherche heuristique à votre place. Pourquoi travailler pendant des heures sur un terminal, alors que vous pouvez simplement laisser votre ordinateur tourner pendant la nuit en laissant STATISTICA Neural Networks faire ce travail pour vous ?
| Retour au Début de la Page |
Entraînement d'un Réseau Neuronal
Plus les types d'architectures et de réseaux vous seront familiers, plus vous regarderez avec un oeil critique la qualité et la rapidité des algorithmes d'entraînement des réseaux. STATISTICA Neural Networks vous offre les meilleurs algorithmes d'entraînement connus à ce jour.
![[Network Example]](gifs/network4.gif)
Pour les Perceptrons Multicouches (PMC), STATISTICA : Réseaux Neuronaux met bien évidemment à votre disposition la Rétro-Propagation - avec un taux et une rapidité d'apprentissage variables en fonction du temps, ainsi qu'un ordre de présentation aléatoire des observations et l'ajout d'un Bruit pour permettre une généralisation robuste. Mais STATISTICA Réseaux Neuronaux contient également 2 algorithmes d'entraînement rapides du second ordre : Descente de Gradients Conjugués et Levenberg-Marquardt. Levenberg-Marquardt est un algorithme moderne très puissant d'optimisation non-linéaire, et il est souvent fortement recommandé par les spécialistes. Toutefois, puisque Levenberg-Marquardt se limite aux réseaux relativement petits avec une seule variable de sortie, STATISTICA Neural Networks vous offre également l'algorithme de Descente de Gradients Conjugués pour traiter des problèmes plus complexes. Ces deux algorithmes convergent souvent beaucoup plus rapidement que l'algorithme de Rétro-Propagation, et fournit dans la plupart des cas une bien meilleure solution.
Les procédures d'entraînement itératives contenues dans STATISTICA Réseaux
Neuronaux sont complétées par un repérage automatique, à la fois de l'erreur d'Entraînement et de l'erreur indépendante de Vérification, avec un Graphique des erreurs globales et une Carte en Barres des erreurs individuelles.
Vous pouvez interrompre l'apprentissage à tout moment en appuyant sur un bouton, et vous avez en plus la possibilité de spécifier des Conditions d'Arrêt pour indiquer le moment où l'apprentissage doit être interrompu prématurément : par exemple, lorsqu'un niveau cible d'erreur est atteint, ou lorsque l'erreur de Vérification se dégrade constamment sur un certain nombre de périodes (indiquant un Sur-apprentissage). Si un sur-apprentissage se produit, pas de panique... STATISTICA Neural Networks conserve automatiquement une copie du Meilleur Réseau rencontré, que vous pouvez alors récupérer en appuyant sur un simple bouton. A la fin de l'entraînement, vous avez la possibilité de tester la performance sur un Ensemble-Test indépendant.
STATISTICA Neural Networks met également à votre disposition divers algorithmes d'entraînement pour d'autres architectures de réseaux. Les Fonctions Radiales de Base (Radial Basis Function) et les Réseaux de Régression Généralisée peuvent avoir les unités d'entrée et les facteurs de lissages appréhendés par une grande variété d'algorithmes, en particulier l'entraînement selon l'algorithme de Kohonen, les techniques de Sous-Echantillonnage, Nuées Dynamiques, Isotrope et Voisin-le-Plus-Proche (saut/distance minimum). Les couches de sortie Linéaires des réseaux de Fonction Radiale de Base (Radial Basis Function) peuvent être optimisées en utilisant une Décomposition en Valeurs Propres, comme pour les réseaux Linéaires.
Hybridation des Structures de Réseaux. STATISTICA : Réseaux Neuronaux vous permet également de réaliser des structures de réseaux hybrides : par exemple, un réseau modifié de Fonction Radiale de Base peut posséder une première couche entraînée par l'algorithme de Kohonen, et une seconde couche non-linéaire entraînée par Levenberg-Marquardt.
| Retour au Début de la Page |
Exploration et Test d'un Réseau de Neurones
Une fois le réseau obtenu, vous allez vouloir le tester afin d'évaluer ses performances et évaluer ses caractéristiques. STATISTICA Réseaux Neuronaux vous offre de nombreuses fonctionnalités statistiques et graphiques à l'écran.

Toutes les statistiques sont produites indépendamment pour les Ensembles d'Entraînement, de Vérification et de Test. Vous pouvez visualiser les poids individuels et les activations du réseau dans des feuilles de données, c'est-à-dire avec un format très pratique ; vous pouvez même, d'un simple clic sur un bouton, les transférer dans STATISTICA sous forme de feuilles de résultats. Mais vous pouvez tout aussi simplement copier ces données dans le Presse-papiers, ou les enregistrer dans un fichier en appuyant sur un bouton. Vous pouvez étudier divers types de sorties : sorties post-traitées, activations de neurones de sortie, et vecteurs de codes. Les activations peuvent également être représentées sous forme de Cartes en Barres. Les résultats des observations individuelles, ou de l'ensemble tout entier, peuvent également être étudiés dans des feuilles de données.

Diverses statistiques globales sont calculées, notamment l'erreur moyenne du réseau, la matrice dite de Confusion pour les problèmes de Classification (qui synthétise les classifications correctes et incorrectes pour chacune des classes), ou le Ratio d'Erreur de Régression pour les problèmes de Régression - toutes automatiquement calculées. Les réseaux de Kohonen sont associés à des Cartes Topologiques, permettant l'inspection visuelle des activations unitaires et le ré-étiquetage des observations et unités, en cours d'analyse. Une fenêtre des "Fréquences Gagnantes" vous permet également de localiser instantanément les groupes de la Carte Topologique. Les classifications peuvent également être conduites en utilisant les réseaux conventionnels avec le Diagramme de la Classification produit par STATISTICA Neural Networks (voir ci-dessus). Par exemple, vous pouvez entraîner un réseau d'Analyse en Composantes Principales, et représenter les données sur les deux premiers axes (Composantes Principales).
| Retour au Début de la Page |
Edition du Réseau, Modifications et Mise au Point
STATISTICA Neural Networks vous offre des options intelligentes pour segmenter les réseaux existants ou agréger des réseaux ensemble. Vous avez la possibilité de supprimer des couches entières ; de relier des réseaux comportant un nombre d'Entrées et de Sorties identiques, ou encore d'ajouter ou supprimer des neurones individuels. Ces fonctionnalités permettent la Réduction de Dimensionalité (en pré-traitement) dans le cadre des Réseaux Auto-associatifs, et l'utilisation des Matrices de Perte (pour prendre la décision du coût-minimum) dans STATISTICA Neural Networks. Les matrices de perte sont automatiquement proposées avec les Réseaux de Neurones Probabilistes.
Solutions Imbriquées (Applications sur-mesure permettant
d'Utiliser le moteur STATISTICA Réseaux Neuronaux)
L'interface simple et efficace de STATISTICA Neural Networks vous permet de trouver rapidement des solutions Neuronales à vos problèmes.

Dans certains cas, vous pouvez souhaiter incorporer ces solutions dans votre propre système et, par exemple, les intégrer dans des environnements de calcul plus vastes (comme des procédures prédéfinies sur gros système). L'API (Application Programming Interface) de STATISTICA Neural Networks vous permet de le faire. Deux versions API sont proposées. L'API Limitée permet d'exécuter depuis d'autres applications des réseaux créés et mis au point dans STATISTICA Neural Networks - y compris des programmes écrits en C, C++, Delphi et Visual Basic. L'API Complète vous permet d'utiliser pleinement la puissance des Noyaux Neuronaux de STATISTICA Neural Networks, en particulier la création, l'édition, le chargement et la sauvegarde de Fichiers de Données et de Réseaux, ainsi que l'entraînement de Réseaux en utilisant les algorithmes décrits précédemment. Après avoir acquis le nombre respectif de Licences d'Utilisation, vous pourrez incorporer cette puissante fonctionnalité dans vos propres applications. L'API est accessible par l'intermédiaire des DLL des plates-formes Windows.
| Retour au Début de la Page |
Synthèse des Algorithmes d'Entraînement
STATISTICA Neural Networks peut fonctionner sur de très petits ou anciens systèmes (la version 16-bits peut tourner avec des processeurs 486 ou ultérieurs et 4 Mo de RAM). Toutefois, en raison de la nature intensive des calculs dans de nombreuses procédures, un Pentium avec 16 Mega-octets de RAM est fortement recommandé.
Les réseaux ne sont quasiment pas limités en taille (c'est-à-dire qu'ils peuvent dépasser de loin la taille pratique ou raisonnable que vous aurez jamais l'occasion d'utiliser) : jusqu'à 128 couches par réseau. La version 16-bits est limitée à 8.192 unités par couche, et à 8.192 observations par Ensemble de Données. La version 32-bits n'est, quant à elle, limitée que par les possibilités de votre ordinateur.
Le programme STATISTICA Neural Networks est accompagné d'un manuel largement illustré, introduisant de manière assez complète les concepts des Réseaux de Neurones (avec de nombreux exemples commentés), et contient une Aide en ligne accessible depuis chaque boîte de dialogue.
| Retour au Début de la Page |
Les réseaux de neurones peuvent s'utiliser dans toutes les situations (virtuellement) où l'objectif consiste à déterminer une variable (attribut) inconnue à partir d'observations (mesures) connues (c'est-à-dire, diverses formes de régression, classification, et série chronologique), pour lesquelles vous possédez un recul historique suffisant, et où il existe une relation ou un ensemble de relations sous-jacentes (les réseaux sont assez tolérants au bruit). En outre, les réseaux de neurones peuvent être utilisés en analyse exploratoire en recherchant les groupes de données (réseaux de Kohonen), et peuvent être utilisés comme estimateurs des fonctions de densité de probabilités.
Vous trouverez dans le chapitre sur les Réseaux de Neurones du Manuel Electronique de StatSoft (disponible sur le WEB de StatSoft) une présentation complète des considérations théoriques indiquant dans quelles applications les Réseaux de Neurones ont de bonnes chances de fournir des résultats probants. La liste ci-dessous vous donne des exemples représentatifs, ne prétendant nullement couvrir l'intégralité des domaines pour lesquels les Réseaux de Neurones peuvent être utilisés.
| Retour au Début de la Page |
![]() |
![]() |