CENTRE NATIONAL D'ETUDES SPATIALES

Groupe d'Etudes des Phénomènes Aérospatiaux Non-identifiés

Toulouse, le 21 avril 1980
N° 105 CT/GEPAN


 

NOTE TECHNIQUE N°2


 

Etude comparative
des résultats statistiques élémentaires
relatifs aux observations
de phénomènes aérospatiaux non identifiés




SOMMAIRE

PRÉSENTATION

INTRODUCTION

1 - DEMARCHE

1.1. Démarches générales
1.2. Description du fichier national
1.3. Comparaison des fichiers

2 - FICHIERS DES RAPPORTS DE GENDARMERIE

2.1. Présentation
2.2. Description des histogrammes

3 - COMPARAISON DES FICHIERS

3.1. Présentation
3.2. Compatibilité des codes
3.3. Comparaison

4 - CONCLUSIONS

4.1. Les fichiers
4.2. Les variables
4.3. Perspectives

BIBLIOGRAPHIE

ANNEXE




PRÉSENTATI0N

par Alain ESTERLE

Cette seconde Note Technique s'inscrit dans la perspective définie par la première Note Technique et la première Note d'Information déjà parues.

En effet, la première Note Technique explicitait l'ensemble des méthodes utilisées au GEPAN pour l'analyse, la classification et le codage des documents de témoignages d'observations et discutait les problèmes nés des choix faits dans ces domaines. La première Note d'Information présentait un travail effectué et publié en URSS, travail d'études statistiques d'un ensemble d'observations faites dans ce pays.

Nous avions alors signalé l'intérêt qu'il pouvait y avoir à comparer des études statistiques similaires faites sur des fichiers de contenus indépendants ( par le lieu, l'époque, … ). C'est pourquoi nous présentons maintenant l'image statistique du fichier construit à partir des procès verbaux de la Gendarmerie nationale française, jusqu' en 1978, ainsi qu'un traitement de comparaison avec d'autres fichiers français, soviétiques et américains.

Il ne s'agit encore là que d'une approche partielle. D'autres études et méthodes statistiques plus élaborées seront développées ultérieurement, comme il est expliqué en conclusion du présent travail.

Enfin rappelons que l'approche statistique n'est qu'un volet de recherche parmi d'autres. En particulier, on pourra trouver dans les Notes Techniques à venir, quelques études de cas dont les rapports sont actuellement en préparation.




ETUDE COMPARATIVE
DES RÉSULTATS STATISTIQUES ÉLÉMENTAIRES
RELATIFS AUX OBSERVATIONS
DE PHÉNOMÈNES AÉROSPATIAUX NON IDENTIFIÉS

- par Philippe BESSE -

INTRODUCTION

A partir des procès-verbaux établis par la Gendarmerie nationale, a été constitué un fichier contenant actuellement 188 observations classées, après expertise, dans la rubrique "D" * :
"rapports pour lesquels il n'est pas possible, malgré les détails décrits, d'identifier le phénomène observé".

On se propose alors, dans une première étape, de décrire de façon élémentaire, le contenu de ce fichier en utilisant au mieux les possibilités du codage de ce fichier ( version 4 - cf. [Duv 79] ) pour compléter l'étude de [Leg 79], et comparer les résultats à ceux obtenus pour d'autres fichiers ( [Poh 76] , [GMP 79] et [Hen 79] ).

* : Sur un ensemble de 700 procès-verbaux examinés, environ.

1. DEMARCHE

1.1. REMARQUES GENERALES

L'utilisation d'outils statistiques pour l'étude des phénomènes aérospatiaux non identifiés, a déjà suscité de nombreuses critiques ( [Pou 75], [Tou 75], [Hen 79] ... ). Ainsi, nécessitant un codage des données et travaillant sur des histogrammes, moyennes, corrélations, ... ils imposent une perte sévère de l'information contenue dans la masse des rapports. Mais, ce moyen d'étude, dont le but est de mettre en évidence des propriétés du ou des phénomènes, parait indispensable ( cf [Hen 79J , p. 241 ), car seul susceptible de considérer globalement les observations accumulées depuis des années. Il doit alors, afin de ne pas l'occulter, rester complémentaire de l'étude individuelle de cas ( cf [Ros 78] ).

Afin d'éviter toute confusion, souvent à l'origine de nombreuses critiques, il est bon de rappeler certaines notions élémentaires indispensables à toute étude statistique. L'usage distingue deux approches :

  • l'une descriptive fait appel à des outils élémentaires ( histogrammes ) ou plus élaborés ( analyses factorielles, classifications ) elle ne nécessite pas d'hypothèse préliminaire et vise à décrire de façon synthétique la structure des données. Ainsi, les termes de population ou d'échantillon désignent exclusivement l'ensemble des individus ou éléments d'information décrits dans le fichier ;
  • l'autre est inférentielle ; elle nécessite un modèle probabiliste ( O, a, P ) ou O désigne l'ensemble des individus ( la population ou population parente ), a est l'ensemble des parties de O, et P une loi de probabilité inconnue. A partir d'un échantillon statistique ( une suite de variables aléatoires indépendantes et de même loi ) on cherche donc à déterminer P et, suivant que l'on admettra ou non des hypothèses sur P, on utilisera des outils nommés paramétriques ou non paramétriques.

Pour plus de clarté, le mot "ensemble" est employé dans la suite pour désigner la "population" d'une étude descriptive. Ce travail présente deux volets :

  • description brute du fichier national à l'aide d'histogrammes,
  • comparaison avec des fichiers déjà existants.

Il nécessite de définir les concepts utilisés ainsi que :

  • l'ensemble décrit,
  • la (ou les) population(s) dont sont extraits les échantillons comparés.

1.2. DESCRIPTION DU FICHIER NATIONAL

1.2.1. LE "PHENOMENE OVNI"

La réalité objective et expérimentale du "phénomène OVNI" n'est pas l'existence d'"objets" volants non identifiés mais celle de témoins. Ceci impose alors de considérer une situation globale définie par différents pôles :

  • un (ou des) phénomène(s) : c'est "ce qui est perçu par les sens" ;
  • un (ou des) témoin (s) : c'est une personne qui, faisant une observation et ne pouvant l'identifier è un phénomène connu par elle, a décidé d'en faire un témoignage ;
  • un environnement : pris dans un sens large, il est physique ( météo, typographie du lieu, ...) et socio-culturel ( par exemple : importance donnée aux "soucoupes volantes" dans les média ) ;
  • un (ou des) témoignage(s) : c'est la relation par le témoin de son observation ;
  • un canal de transfert de l'information : pour le fichier considéré, il s'agit de la Gendarmerie nationale qui, à partir des facteurs : témoin - environnement - témoignage, constitue un procès- verbal d'enquête.

La situation ainsi définie peut se représenter par un schéma qui n'a aucune valeur fonctionnelle de modélisation: Il permet juste d'illustrer la complexité dialectique du "phénomène OVNI" qui se présente sous différents aspects.

1.2.2. COMPLEXITE DU PHENOMENE

  • Les "individus" de la "population" étudiée apparaissent donc comme des systèmes dont les mécanismes sont par ailleurs très mal connus. Par exemple :

    • Quels sont les facteurs déterminants qui décident le témoin à relater son observation ? : campagne de presse sur les "soucoupes volantes", psychologie du témoin, "étrangeté" de l'observation ?
    • Dans quelle mesure un conditionnement culturel, une observation traumatisante peut modifier les perceptions d'un témoin et quelle peut être l'influence du phénomène sur l'environnement ou de l'observateur sur le phénomène ?
    • Les médias jouent le rôle d'un "feed back" et modifient la connaissance a priori et ainsi les conditions de l'interprétation a postériori des phénomènes non identifiés.
  • Cette conception systémique imposée par la complexité rapidement survolée du phénomène OVNI, se heurte alors au manque d'information. Chaque élément du puzzle, surtout à travers les rapports d'observation, est peu documenté. Il paraît illusoire de vouloir sérier tous les paramètres et ainsi, le problème majeur, dans la recherche de modèles, et le choix des approximations, est d'isoler des sous systèmes dont on suppose connus tous les facteurs déterminants afin d'en cerner les comportements.

    La méconnaissance de certains facteurs, habituellement sur ou sous estimés suivant le but poursuivi : psychologie de la perception, phénomènes de rumeurs, impose une prudente réserve dans les interprétations et hypothèses qui accompagnent un travail même descriptif.

1.2.3. SPECIFICITE DU FICHIER ETUDIE

  • Définition des individus :

    L'objet de l'étude est la population des phénomènes aérospatiaux non identifiés ; mais il est clair que ceci nécessite la connaissance des filtres qui séparent le traitement statistique du ou des phénomènes originels. Ainsi, de même que pour tout fichier ufologique, l'ensemble des individus sera l'ensemble de ce qui est observable c'est à dire l'ensemble des témoignages codés. L'individu de base est donc ce que décrivent (mesurent) les variables considérées par le code, c'est à dire l'entité à 5 pôles décrite ci dessus.

    Cette approche est rigoureuse mais peu pratique. Aussi, pour simplifier la tâche et rendre le fichier compatible avec ceux existants, en présence de procès-verbaux relatant l'observation de plusieurs phénomènes ou plusieurs témoignages indépendants ou non d'un même phénomène, on est conduit à l'approximation décrite au § 2.1.

  • Les remarques d'ordre général précédentes restent applicables à tous fichiers qui se distinguent entre eux par les modes de collecte et de sélection des témoignages. L'originalité du fichier exploité au GEPAN vient avant tout de l'utilisation des rapports de Gendarmerie comme source d'information.

    Deux avantages importants en résultent :

    • Homogénéité spatio-temporelle des capteurs : Les brigades de Gendarmerie étant réparties sur tout le territoire, on peut espérer, pour des études ultérieures de modélisation spatiale, éviter l'écueil décrit en [Hen 79] où les observations se regroupent très nettement autour des centres de saisie des données ;

    • Homogénéité des procédures d'enquête :
      L'établissement du procès-verbal suit une démarche normalisée aussi, contrairement aux fichiers utilisant des sources diverses, on peut supposer que les informations sont certes filtrées mais le sont, en moyenne, de façon constante. Ceci signifie qu'une étude inférentielle admettra l'hypothèse suivante : "les rapports de Gendarmerie introduisent des biais systématiques ( encore à déterminer ) dans les informations concernant les observations d'OVNI mais, les différences inter-brigades ou inter-gendarmes ne superposent qu'un bruit aléatoire.

  • L'expertise est le filtre suivant dans la chaîne de traitement. Celle-ci peut s'interpréter comme une "mesure" qualitative ( cf [Jim 79] ) mais, conduisant dans le cas présent à une sélection, elle constitue un filtre supplémentaire. Aussi, pour faire intervenir l'expertise comme un facteur externe, il faudra reconduire cette étude en considérant tous les cas lorsque ceux-ci seront codés.

    Ceci revient à définir différemment le "phénomène OVNI" ( cf [Ros 79] ) suivant qu'on le considére avant l'expertise :

    • "Existence de personnes qui ont rapporté avoir vu des lumières ou des objets inhabituels dans le ciel ou au sol, ou près du sol, accompagnés parfois d'enregistrements physiques ( trace, photo, écho radar, ... )",

    ou après :

    • "Ces témoignages, soumis à une analyse méthodique auprès des témoins, et sur le site de l'observation alléguée ne peuvent être attribués en toute rigueur ni à des affabulations, ni à des mésinterprétations".

    Ceci est équivalent, dans le schéma du § 1.2.1. à prendre ou non en compte l'expertise dans le canal de transfert de l'information.

  • Le dernier travail préliminaire à l'étude statistique concerne le codage indispensable pour l'informatisation des traitements. Les problèmes que soulève une telle étape sont abondamment commentés en [Ros 78]. Sans revenir sur ceux-ci, deux remarques peuvent être faites :
    • A ce niveau intervient un grand nombre de choix ( choix des entrées, des variables, des modalités ) soumis à des impératifs contradictoires : praticabilité du codage et du fichier, minimisation de la perte d'information ;

    • Ces choix nécessitent une connaissance des traits majeurs des phénomènes ainsi que des objectifs recherchés par l'étude statistique ; ils ne peuvent être définitifs.

  • En conclusion, la complexité du phénomène OVNI, brièvement décrite ci dessus est telle que l'interprétation des résultats statistiques nécessite des choix parmi toutes les combinaisons possibles entre les différents facteurs ( psychologiques, sociologiques, physiques ). Tant que les mécanismes cités au § 1.2.1. n'auront pas été spécifiquement étudiés, ces choix restent prématurés car soumis à toute la subjectivité, à tout l'a priori du chercheur.

    Ces précautions élémentaires doivent également tenir compte de l'influence des canaux de transfert de l'information. En effet, si cette influence peut être évaluée dans une étude de cas approfondie, elle devient très préjudiciable à une étude statistique lorsque sont confondus constantes du (ou des) phénomène (s) et biais introduits par "l'appareil de mesure".

1.3. COMPARAISON DES FICHIERS

1.3.1. PROBLEMES

Les différents fichiers considérés, sont soumis aux même remarques générales ( complexité du problème, filtrage et insuffisance de l'information ) et leur comparaison pose des problèmes à différents niveaux lorsqu'il faut remonter le canal de transfert de l'information.

La première question posée concerne la compatibilité des codages. La variable étudiée "mesure t-elle" le même paramétre ? Les modalités sont-elles définies et utilisées de la même manière ?

Il s'agit ensuite de discerner la présence probable de biais introduits par les modes de sélection répondant à des critères variés ainsi que ceux amenés par les différentes sources d'information.

Enfin, si ces barrages sont franchis, la comparaison des histogrammes devient possible mais aboutit à un faisceau d'interprétations ou d'hypothèses faisant intervenir les différents facteurs déjà cités.

1.3.2. TEST D'HOMOGENEITE ( CF. [Sie 56] )

Pour dépasser le stade de la ressemblance "visible" de deux histogrammes, on peut utiliser le test du X². Sous deux hypothéses :

  • les fichiers décrivent des échantillons aléatoires,
  • ils sont indépendants entre eux.

Ce test conduit à accepter ou à réfuter à un certain seuil de signification ( en général 5 % ) l'hypothèse Ho suivante :

Ho = "les échantillons considérés sont tirés d'une même population"

Comme dans tout cadre inférentiel, la population parente ainsi supposée d'où seraient issus les échantillons doit être définie.

1.3.3. INTERPRETATION

Telle qu'elle est définie ici, la démarche proposée n'a rien d'original puisqu'il s'agit de décrire un fichier d'observations puis, à partir de plusieurs fichiers - échantillons supposés indépendants entre eux, d'induire des hypothèses expérimentables sur une population de plus en plus vaste. L'originalité vient du sujet de l'étude et se caractérise par un rapport complexité quantité d'information peu commun.

Les interprétations proposées au § 3 n'ont rien d'absolu et, se situent toujours dans un cadre descriptif, suivent une règle de moindre "coût". En effet, puisque la démarche se propose de remonter la chaîne des filtres, on fait le choix a priori d'interpréter les résultats en fonction du niveau auquel se situe la comparaison.

Exemple :

On constate que le nombre de témoins isolés est, comparativement, nettement inférieur dans le fichier de GN. Deux interprétations sont possibles :

  • Depuis 1974, les "extraterrestres" choisissent d'apparaître devant des groupes de témoins jugés plus crédibles qu'un témoin isolé ;
  • Un témoin isolé relate beaucoup plus facilement son observation à la presse, à un groupement privé, qu'à la Gendarmerie.

Ayant remarqué que les codages de cette variable sont compatibles, et supposé qu'une expertise ne tenant pas compte de la crédibilité n'influe pas trop sur la variable, on choisit la deuxième car, au niveau où on se situe, elle explique le plus simplement, jusqu'à preuve du contraire, les différences significatives ( au sens du test du X² ) entre les distributions.




SUITE...




© CNES