CENTRE NATIONAL D'ETUDE SPATIALES

Groupe d'Etude des Phénomènes Aérospatiaux Non-identifiés

Toulouse, le 29 octobre 1979

NOTE TECHNIQUE N°1


 

Analyse du problème
du pré-traitement des données




SOMMAIRE

PRÉSENTATION

CHAPITRE 1 - Les techniques d'expertise

( Alain ESTERLE )

CHAPITRE 2 - Règles de codage ( 4ème version GEPAN )

( Jacques DUVAL )

CHAPITRE 3 - Rapport d'études statistiques

( Paul LEGENDRE )

CHAPITRE 4 - Réflexion sur les principes du pre-traitement

( Manuel JIMENEZ )

CHAPITRE 5 - Etude des problèmes liés à la création d'un fichier informatique

( Jean-Pierre ROSPARS )

CHAPITRE 6 - Les méthodes de traitement de I'information appliquées aux phénomènes OVNI

( Michel MARCUS )

CONCLUSION




CHAPITRE 4

RÉFLEXIONS SUR LES PRINCIPES DU PRÉ-TRAITEMENT

Par Manuel JIMENEZ

EXPERTISE : Visite et opérations des experts
EXPERT : Personne apte à juger de quelque chose

( Larousse de poche )

Une expertise est donc un Jugement compétent. C'est à dire un classement d'un objet d'étude : l'étiquetage de cet objet avec une valeur d'une variable donnée ( cette variable pouvant être simplement dichotomisée, ou être nominale (1) ).

(1) Ou être composée de plusieurs variables qui présentent, ou pas, des valeurs caractéristiques. C'est le cas du "tableau clinique" ou du "profil psychologique".

Cela revient à dire que l'expertise est une mesure, et l'expert l'instrument de mesure. Une mesure doit répondre à des critères de fidélité et de validité :

  • le critère de fidélité demande que deux mesures effectuées sur un même objet soient identiques ( ou différer à l'intérieur d'une marge pré-établie ), et indépendamment de toute variation extérieure à l'objet. Dans le cas de l'expert, cela signifie qu'un même objet doit être classé de la même façon par deux experts différents, ou par le même expert à deux moments différents ;
  • le critère de validité exige que la mesure corresponds biens à une et une seule valeur de concept qu'elle est censée mesurer.

C'est à dire que le rapport entre la variable opérationnelle ( définie par l'opération de mesure ) et la variable théorique qu'on veut atteindre doit être le plus étroit possible.

Ce problème ne se pose pas lorsque la variable théorique et la variable opérationnelle ne font qu'une : lorsque le concept est défini par la mesure. C'est le cas de beaucoup de mesures physiques ( par exemple, la température ).

Par contre, lorsque le concept est "abstrait" (2), ce rapport ne peut être défini que par raisonnement logique à l'intérieur d'un cadre théorique donné. C'est le cas de la plupart des variables psychologiques ( par exemple, l'intelligence ) ; C'est aussi le cas, en principe de concepts tels que la crédibilité, l'intérêt, voire l'identification. De toutes façons, l'établissement de ce rapport passe par l'explicitation du concept dans une définition, qui est une définition opérationnelle, si non de la mesure, au moins du concept.

(2) "abstrait" défini, par négation, comme ce qui ne peut pas être atteint directement.

Ainsi, une façon commode de valider une mesure est de définir le concept, même s'il est abstrait, par la mesure elle-même (3). Ce qui est important c'est qu'une mesure constitue une information potentielle susceptible d'être utilisée pour un traitement ultérieur.

(3) C'est le cas de la boutade attribuée à BINET : "L'intelligence, c'est ce que mesure mon test" (d'intelligence).

Pour que ce traitement soit fait sans erreur, il est absolument nécessaire que :

  1. le sujet qui mesure et le sujet qui traite l'information aient la même définition de concept théorique mesuré ( ou censé être mesuré ) ;
  2. qu'ils soient d'accord sur les bases théoriques de la validité de la mesure, et sur son degré de fidélité.

Dire que cela équivaut à dire que l'information apportée par une mesure doit être accompagnée par l'information indiquant comment cette mesure a été faite. Cette deuxième information devenant ainsi partie pertinente de l'information apportée par la mesure.

DE L'IMPLICITE DANS LA MESURE

On pourrait penser que toutes ces explications ne sont pas nécessaires sans la limite où tous les sujets - ceux qui mesurent, ceux qui traitent la mesure, ceux qui lisent les traitements - s'adressent à une même définition implicite de la mesure et du concept mesuré.

Or, une innombrable quantité de travaux montrent l'extrême variabilité de la perception humaine qu'il s'agisse de la perception des données physiques ou de la perception sociale. En particulier, ces travaux montre que :

    même lorsque un sujet dispose d'un cadre implicite de mesure, ce cadre est soumis à des variations intra-individuelles non contrôlable, se traduisant par un aléatoire dans la mesure ;

    on constate, de même, des variations intra-individuelles considérables dans les mesures et les cadres correspondants, même lorsque ceux-ci sont explicités individuellement (4).

(4) Regarder, par exemple, les recherches de NOIZET et CAVERNI (1978) sur l'évaluation des lycéens, ou celles de ROSENTHAL et JACOBSON (1968) sur l'effet Pygmalion.

DE LA MESURE LORS DE L'EXPERTISE DES RAPPORTS D'OVNI

Très peu de choses sont explicites dans la mesure faite lors d'une expertise de rapports d'OVNI, qui conduit à classer ce rapport sans une des quatre catégories possibles : A, B, C ou D.

A notre connaissance, les seules explicitations existantes dans la littérature interne au GEPAN, font acte des définitions de ces quatre catégories :

  • A - phénomène identifié
  • B - phénomène probablement identifié
  • C - phénomène non-identifié mais le document manque d'intérêt (détails, cohésion,...)
  • D - phénomène non-identifié et document cohérent, complet et détaillé.

Une analyse de ces définitions indique dans ces catégories un amalgame de plusieurs variables sous-jacentes :

  • une variable identification du phénomène, ordinale, pouvant avoir trois valeurs : identifié, probablement identifié ou non-identifié ;
  • trois variables ordinales dichotomisées : "détail", "cohésion" ( ou "cohérence" ) et complétude desquelles on retient une combinaison ( "cohérent, complet et détaillé" ) ; toutes les autres combinaisons (sept) sont considérées ensemble.

Cela semble pouvoir se traduire par la grille d'expertise suivante :

Mais cela constitue uniquement une explicitation des valeurs possibles de quelques variables théoriques. En aucune manière, ne sont définies :

  • ces variables,
  • la façon comme elles et/ou leurs valeurs correspondantes sont mesurées.

Il résulte de cette analyse que, en absence de toute autre explicitation, les mesures faites sur ces variables, et le classement qui s'en suit, peuvent dépendre des variations infra et inter-personnelles inhérentes à toute grille d'analyse implicite humaine.

D'où le besoin...

QUELQUES PISTES

Deux mesures semblent avoir leur place lors de l'expertise d'un rapport d'OVNI :

  • celle de l'information contenue dans le rapport,
  • celle de l'identification de cette information.

Il semble difficile, lors d'une éventuelle mesure de l'information d'englober dans une seule échelle - dans une seule mesure - des estimations de la cohérence et de la quantité d'informations d'un rapport d'OVNI.

  • Par cohérence, on entend l'absence de contradiction dans le rapport, au sens logico-linguistique.
  • Par quantité d'informations on entend simplement, l'inverse de la probabilité d'apparition d'un message. Cela semble inclure la complétude et le "détail".

Un rapport peut être fort cohérent mais apporter peu d' informations et vice-versa. Mais, le manque de cohérence peut être considéré, en première analyse, comme une quantité d'informations supplémentaires. Dans la mesure où cette information supplémentaire n'est pas celle recherchée lors de la mesure de la quantité d'informations, l'expertise pourrait, pour l'éviter, procéder dans l'ordre :

  • mesure de la cohérence,
  • mesure de la quantité d'informations.

Une meilleure façon est de définir la "quantité d'informations" telle qu'elle exclut la cohérence
( voir aussi à ce sujet le § 1 du chapitre 6 ).

L'OVNI étant par définition inconnu, on ne dispose pas de corpus de description permettant d'indiquer la probabilité d'apparition d'un rapport d'OVNI donné, ou d'une caractéristique d'OVNI donné. Mais, le GEPAN dispose d'une quantité non négligeable de descriptions, dont un certain nombre déjà codées, qui peuvent être utilisées comme matériau brut à l'élaboration de ce corpus.

La théorie de l'information doit permettre, à partir de ce corpus, la quantification univoque de l'information apportée par un nouveau rapport, en fonction de la probabilité d'apparition des caractéristiques y étant décrites et de l'agencement de ces caractéristiques.

Il est certainement plus difficile de quantifier la cohérence d'un rapport. Dans une première approximation, la cohérence peut se mesurer comme l'inverse du nombre de contradictions se trouvant dans un rapport. Une deuxième approximation devrait pondérer cette note en relation avec l'information brute du rapport : nombre de mots, ou de lignes, ou de caractéristiques (5), etc.

(5) Il est logique de penser qua la probabilité, pour un témoin moyen, de se contredire croit avec la longueur de son rapport ....

  • Cette information brute peut, le cas échéant, être considérée comme une toute première estimation d'une "quantité d'informations" du rapport (6).

(6) Il est nécessaire dans ce cas, de reprendre la définition de la "quantité d'informations" apportée par un rapport d'OVNI.

Mais, une bonne mesure - une bonne définition - de la cohérence d'un rapport doit tenir compte de la logique des contradictions, en fonction par exemple, de leurs probabilités d'apparition dans des descriptions d'ordre commun. Certaines contradictions sort certainement plus courantes - plus "normales" - que d'autres.

La mesure de l'identification de l'information continue dans un rapport d'OVNI semble fort délicate. Elle doit tenir compte en même temps, de la quantité d' informations externes - des OVI ou plutôt des PAI - dont l'expert dispose et du degré de relation entre les caractéristiques de l'OVNI expertisé et celles des OVI. Mais, elle doit aussi être pondérée par rapport à l'information contenue dans le rapport d'OVNI.

Autrement dit, une note brute de l'identification indique le nombre brut des caractéristiques de l'OVNI qui se retrouvent dans un OVI ( y inclus les coordonnées Spatio-temporelles ). Ensuite, cette note doit être pondérée en fonction de la quantité d'informations contenue dans le rapport, de la quantité d'informations extérieures et de l'importance relative des caractéristiques retrouvées.

La fabrication de ces instruments de mesure n'est pas simple. Elle impose en même temps, un travail théorique ( cf. la théorie de l'information ) et un travail statistique à partir des rapports déjà codés, des informations des éventuels OVI.

Elle permet de créer, cependant, trois échelles :

  • de cohérence,
  • d'information,
  • d'identification,
où on peut voter de façon univoque éventuellement chaque rapport d'OVNI.

A partir de là, l'expertise pourrait procéder comme suit :

En tout cas, un rapport classé de cette façon A ou D, dispose après expertise de trois notes objectives :

  • cohérence,
  • information,
  • identification.

LIMITES

Cette démarche n'est que le fruit d'une réflexion rapide. Elle est destinée à subir des critiques, autant d'ordre théorique que méthodologique.

Elle ne prétend pas être la seule à suivre, pas même une parmi les démarches possibles. Elle est plutôt une illustration, certainement trop rapide, d'un cheminement qui se veut objectif avec le seul but d'ajouter le moins de bruit possible à l'information à traiter.

C'est le premier souci à avoir, au cours de l'expertise.




SUITE...




© CNES