|
CENTRE NATIONAL D'ETUDES SPATIALES
Groupe d'Etudes des Phénomènes Aérospatiaux Non-identifiés
 |
Toulouse, le 21 avril 1980 N° 105 CT/GEPAN
|
NOTE TECHNIQUE N°2
Etude comparative
des résultats statistiques élémentaires
relatifs aux observations
de phénomènes aérospatiaux non identifiés
PRÉSENTATION
INTRODUCTION
1 - DEMARCHE
1.1. Démarches générales
1.2. Description du fichier national
1.3. Comparaison des fichiers
2 - FICHIERS DES RAPPORTS DE GENDARMERIE
2.1. Présentation
2.2. Description des histogrammes
3 - COMPARAISON DES FICHIERS
3.1. Présentation
3.2. Compatibilité des codes
3.3. Comparaison
4 - CONCLUSIONS
4.1. Les fichiers
4.2. Les variables
4.3. Perspectives
BIBLIOGRAPHIE
ANNEXE
par Alain ESTERLE
Cette seconde Note Technique s'inscrit dans la perspective définie par la première Note Technique
et la première Note d'Information déjà parues.
En effet, la première Note Technique explicitait l'ensemble des méthodes utilisées au GEPAN pour
l'analyse, la classification et le codage des documents de témoignages d'observations et discutait les
problèmes nés des choix faits dans ces domaines. La première Note d'Information présentait un
travail effectué et publié en URSS, travail d'études statistiques d'un ensemble d'observations faites
dans ce pays.
Nous avions alors signalé l'intérêt qu'il pouvait y avoir à comparer des études statistiques similaires
faites sur des fichiers de contenus indépendants ( par le lieu, l'époque, … ). C'est pourquoi nous
présentons maintenant l'image statistique du fichier construit à partir des procès verbaux de la
Gendarmerie nationale française, jusqu' en 1978, ainsi qu'un traitement de comparaison avec
d'autres fichiers français, soviétiques et américains.
Il ne s'agit encore là que d'une approche partielle. D'autres études et méthodes statistiques plus
élaborées seront développées ultérieurement, comme il est expliqué en conclusion du présent travail.
Enfin rappelons que l'approche statistique n'est qu'un volet de recherche parmi d'autres. En
particulier, on pourra trouver dans les Notes Techniques à venir, quelques études de cas dont les
rapports sont actuellement en préparation.
ETUDE COMPARATIVE
DES RÉSULTATS STATISTIQUES ÉLÉMENTAIRES
RELATIFS AUX OBSERVATIONS
DE PHÉNOMÈNES AÉROSPATIAUX NON IDENTIFIÉS
- par Philippe BESSE -
A partir des procès-verbaux établis par la Gendarmerie nationale, a été constitué un fichier contenant
actuellement 188 observations classées, après expertise, dans la rubrique "D" * :
"rapports pour lesquels il n'est pas possible, malgré les détails décrits, d'identifier le phénomène observé".
On se propose alors, dans une première étape, de décrire de façon élémentaire, le contenu de ce
fichier en utilisant au mieux les possibilités du codage de ce fichier ( version 4 - cf. [Duv 79] )
pour compléter l'étude de [Leg 79], et comparer les résultats à ceux obtenus pour d'autres fichiers ( [Poh 76]
, [GMP 79] et [Hen 79] ).
* : Sur un ensemble de 700 procès-verbaux examinés, environ.
1.1. REMARQUES GENERALES
L'utilisation d'outils statistiques pour l'étude des phénomènes aérospatiaux non identifiés, a déjà
suscité de nombreuses critiques ( [Pou 75], [Tou 75], [Hen 79] ... ). Ainsi, nécessitant un codage des
données et travaillant sur des histogrammes, moyennes, corrélations, ... ils imposent une perte
sévère de l'information contenue dans la masse des rapports. Mais, ce moyen d'étude, dont le but est
de mettre en évidence des propriétés du ou des phénomènes, parait indispensable ( cf [Hen 79J , p.
241 ), car seul susceptible de considérer globalement les observations accumulées depuis des
années. Il doit alors, afin de ne pas l'occulter, rester complémentaire de l'étude individuelle de cas ( cf
[Ros 78] ).
Afin d'éviter toute confusion, souvent à l'origine de nombreuses critiques, il est bon de rappeler
certaines notions élémentaires indispensables à toute étude statistique. L'usage distingue deux
approches :
- l'une descriptive fait appel à des outils élémentaires ( histogrammes ) ou plus élaborés
( analyses factorielles, classifications ) elle ne nécessite pas d'hypothèse préliminaire et vise à
décrire de façon synthétique la structure des données. Ainsi, les termes de population ou
d'échantillon désignent exclusivement l'ensemble des individus ou éléments d'information
décrits dans le fichier ;
- l'autre est inférentielle ; elle nécessite un modèle probabiliste ( O, a, P ) ou O désigne
l'ensemble des individus ( la population ou population parente ), a est l'ensemble des parties de
O, et P une loi de probabilité inconnue. A partir d'un échantillon statistique ( une suite de
variables aléatoires indépendantes et de même loi ) on cherche donc à déterminer P et,
suivant que l'on admettra ou non des hypothèses sur P, on utilisera des outils nommés
paramétriques ou non paramétriques.
Pour plus de clarté, le mot "ensemble" est employé dans la suite pour désigner la "population" d'une
étude descriptive. Ce travail présente deux volets :
- description brute du fichier national à l'aide d'histogrammes,
- comparaison avec des fichiers déjà existants.
Il nécessite de définir les concepts utilisés ainsi que :
- l'ensemble décrit,
- la (ou les) population(s) dont sont extraits les échantillons comparés.
1.2. DESCRIPTION DU FICHIER NATIONAL
1.2.1. LE "PHENOMENE OVNI"
La réalité objective et expérimentale du "phénomène OVNI" n'est pas l'existence d'"objets" volants
non identifiés mais celle de témoins. Ceci impose alors de considérer une situation globale définie
par différents pôles :
- un (ou des) phénomène(s) : c'est "ce qui est perçu par les sens" ;
- un (ou des) témoin (s) : c'est une personne qui, faisant une observation et ne pouvant
l'identifier è un phénomène connu par elle, a décidé d'en faire un témoignage ;
- un environnement : pris dans un sens large, il est physique ( météo, typographie du lieu, ...) et
socio-culturel ( par exemple : importance donnée aux "soucoupes volantes" dans les média ) ;
- un (ou des) témoignage(s) : c'est la relation par le témoin de son observation ;
- un canal de transfert de l'information : pour le fichier considéré, il s'agit de la Gendarmerie
nationale qui, à partir des facteurs : témoin - environnement - témoignage, constitue un procès-
verbal d'enquête.
La situation ainsi définie peut se représenter par un schéma qui n'a aucune valeur fonctionnelle de
modélisation: Il permet juste d'illustrer la complexité dialectique du "phénomène OVNI" qui se
présente sous différents aspects.

1.2.2. COMPLEXITE DU PHENOMENE
-
Les "individus" de la "population" étudiée apparaissent donc comme des systèmes dont les
mécanismes sont par ailleurs très mal connus. Par exemple :
- Quels sont les facteurs déterminants qui décident le témoin à relater son observation ? :
campagne de presse sur les "soucoupes volantes", psychologie du témoin, "étrangeté"
de l'observation ?
- Dans quelle mesure un conditionnement culturel, une observation traumatisante peut
modifier les perceptions d'un témoin et quelle peut être l'influence du phénomène sur
l'environnement ou de l'observateur sur le phénomène ?
- Les médias jouent le rôle d'un "feed back" et modifient la connaissance a priori et ainsi
les conditions de l'interprétation a postériori des phénomènes non identifiés.
- …
Cette conception systémique imposée par la complexité rapidement survolée du phénomène
OVNI, se heurte alors au manque d'information. Chaque élément du puzzle, surtout à travers
les rapports d'observation, est peu documenté. Il paraît illusoire de vouloir sérier tous les
paramètres et ainsi, le problème majeur, dans la recherche de modèles, et le choix des
approximations, est d'isoler des sous systèmes dont on suppose connus tous les facteurs
déterminants afin d'en cerner les comportements.
La méconnaissance de certains facteurs, habituellement sur ou sous estimés suivant le but
poursuivi : psychologie de la perception, phénomènes de rumeurs, impose une prudente
réserve dans les interprétations et hypothèses qui accompagnent un travail même descriptif.
1.2.3. SPECIFICITE DU FICHIER ETUDIE
- Définition des individus :
L'objet de l'étude est la population des phénomènes aérospatiaux non identifiés ; mais il est
clair que ceci nécessite la connaissance des filtres qui séparent le traitement statistique du ou
des phénomènes originels. Ainsi, de même que pour tout fichier ufologique, l'ensemble des
individus sera l'ensemble de ce qui est observable c'est à dire l'ensemble des témoignages
codés. L'individu de base est donc ce que décrivent (mesurent) les variables considérées par
le code, c'est à dire l'entité à 5 pôles décrite ci dessus.
Cette approche est rigoureuse mais peu pratique. Aussi, pour simplifier la tâche et rendre le
fichier compatible avec ceux existants, en présence de procès-verbaux relatant l'observation
de plusieurs phénomènes ou plusieurs témoignages indépendants ou non d'un même
phénomène, on est conduit à l'approximation décrite au § 2.1.
Les remarques d'ordre général précédentes restent applicables à tous fichiers qui se
distinguent entre eux par les modes de collecte et de sélection des témoignages. L'originalité
du fichier exploité au GEPAN vient avant tout de l'utilisation des rapports de Gendarmerie
comme source d'information.
Deux avantages importants en résultent :
Homogénéité spatio-temporelle des capteurs :
Les brigades de Gendarmerie étant réparties sur tout le territoire, on peut espérer, pour
des études ultérieures de modélisation spatiale, éviter l'écueil décrit en [Hen 79] où les
observations se regroupent très nettement autour des centres de saisie des données ;
Homogénéité des procédures d'enquête :
L'établissement du procès-verbal suit une démarche normalisée aussi, contrairement
aux fichiers utilisant des sources diverses, on peut supposer que les informations sont
certes filtrées mais le sont, en moyenne, de façon constante. Ceci signifie qu'une étude
inférentielle admettra l'hypothèse suivante : "les rapports de Gendarmerie introduisent
des biais systématiques ( encore à déterminer ) dans les informations concernant les
observations d'OVNI mais, les différences inter-brigades ou inter-gendarmes ne
superposent qu'un bruit aléatoire.
L'expertise est le filtre suivant dans la chaîne de traitement. Celle-ci peut s'interpréter comme
une "mesure" qualitative ( cf [Jim 79] ) mais, conduisant dans le cas présent à une sélection,
elle constitue un filtre supplémentaire. Aussi, pour faire intervenir l'expertise comme un facteur
externe, il faudra reconduire cette étude en considérant tous les cas lorsque ceux-ci seront
codés.
Ceci revient à définir différemment le "phénomène OVNI" ( cf [Ros 79] ) suivant qu'on le
considére avant l'expertise :
"Existence de personnes qui ont rapporté avoir vu des lumières ou des objets
inhabituels dans le ciel ou au sol, ou près du sol, accompagnés parfois
d'enregistrements physiques ( trace, photo, écho radar, ... )",
ou après :
"Ces témoignages, soumis à une analyse méthodique auprès des témoins, et sur le
site de l'observation alléguée ne peuvent être attribués en toute rigueur ni à des
affabulations, ni à des mésinterprétations".
Ceci est équivalent, dans le schéma du § 1.2.1. à prendre ou non en compte l'expertise dans
le canal de transfert de l'information.
- Le dernier travail préliminaire à l'étude statistique concerne le codage indispensable pour
l'informatisation des traitements. Les problèmes que soulève une telle étape sont
abondamment commentés en [Ros 78]. Sans revenir sur ceux-ci, deux remarques peuvent être
faites :
A ce niveau intervient un grand nombre de choix ( choix des entrées, des variables, des
modalités ) soumis à des impératifs contradictoires : praticabilité du codage et du
fichier, minimisation de la perte d'information ;
Ces choix nécessitent une connaissance des traits majeurs des phénomènes ainsi que
des objectifs recherchés par l'étude statistique ; ils ne peuvent être définitifs.
En conclusion, la complexité du phénomène OVNI, brièvement décrite ci dessus est telle que
l'interprétation des résultats statistiques nécessite des choix parmi toutes les combinaisons
possibles entre les différents facteurs ( psychologiques, sociologiques, physiques ). Tant que les
mécanismes cités au § 1.2.1. n'auront pas été spécifiquement étudiés, ces choix restent prématurés
car soumis à toute la subjectivité, à tout l'a priori du chercheur.
Ces précautions élémentaires doivent également tenir compte de l'influence des canaux de transfert
de l'information. En effet, si cette influence peut être évaluée dans une étude de cas approfondie, elle
devient très préjudiciable à une étude statistique lorsque sont confondus constantes du (ou des)
phénomène (s) et biais introduits par "l'appareil de mesure".
1.3. COMPARAISON DES FICHIERS
1.3.1. PROBLEMES
Les différents fichiers considérés, sont soumis aux même remarques générales ( complexité du
problème, filtrage et insuffisance de l'information ) et leur comparaison pose des problèmes à
différents niveaux lorsqu'il faut remonter le canal de transfert de l'information.
La première question posée concerne la compatibilité des codages. La variable étudiée
"mesure t-elle" le même paramétre ? Les modalités sont-elles définies et utilisées de la même
manière ?
Il s'agit ensuite de discerner la présence probable de biais introduits par les modes de sélection
répondant à des critères variés ainsi que ceux amenés par les différentes sources d'information.
Enfin, si ces barrages sont franchis, la comparaison des histogrammes devient possible mais aboutit
à un faisceau d'interprétations ou d'hypothèses faisant intervenir les différents facteurs déjà cités.
1.3.2. TEST D'HOMOGENEITE ( CF. [Sie 56] )
Pour dépasser le stade de la ressemblance "visible" de deux histogrammes, on peut utiliser le test du
X². Sous deux hypothéses :
- les fichiers décrivent des échantillons aléatoires,
- ils sont indépendants entre eux.
Ce test conduit à accepter ou à réfuter à un certain seuil de signification ( en général 5 % ) l'hypothèse
Ho suivante :
Ho = "les échantillons considérés sont tirés d'une même population"
Comme dans tout cadre inférentiel, la population parente ainsi supposée d'où seraient issus les
échantillons doit être définie.
1.3.3. INTERPRETATION
Telle qu'elle est définie ici, la démarche proposée n'a rien d'original puisqu'il s'agit de décrire un
fichier d'observations puis, à partir de plusieurs fichiers - échantillons supposés indépendants entre
eux, d'induire des hypothèses expérimentables sur une population de plus en plus vaste. L'originalité
vient du sujet de l'étude et se caractérise par un rapport complexité quantité d'information peu
commun.
Les interprétations proposées au § 3 n'ont rien d'absolu et, se situent toujours dans un cadre
descriptif, suivent une règle de moindre "coût". En effet, puisque la démarche se propose de
remonter la chaîne des filtres, on fait le choix a priori d'interpréter les résultats en fonction du niveau
auquel se situe la comparaison.
Exemple :
On constate que le nombre de témoins isolés est, comparativement, nettement inférieur dans le
fichier de GN. Deux interprétations sont possibles :
-
Depuis 1974, les "extraterrestres" choisissent d'apparaître devant des groupes de
témoins jugés plus crédibles qu'un témoin isolé ;
- Un témoin isolé relate beaucoup plus facilement son observation à la presse, à un
groupement privé, qu'à la Gendarmerie.
Ayant remarqué que les codages de cette variable sont compatibles, et supposé qu'une expertise ne
tenant pas compte de la crédibilité n'influe pas trop sur la variable, on choisit la deuxième car, au
niveau où on se situe, elle explique le plus simplement, jusqu'à preuve du contraire, les différences
significatives ( au sens du test du X² ) entre les distributions.
SUITE...
© CNES
|