|
CENTRE NATIONAL D'ETUDES SPATIALES
Groupe d'Etudes des Phénomènes Aérospatiaux Non-identifiés
 |
Toulouse, le 26 novembre 1982 N° 0148 CT/GEPAN
|
NOTE TECHNIQUE N° 13
RECHERCHE STATISTIQUE D'UNE TYPOLOGIE
IDENTIFIEE / NON-IDENTIFIEE
ISSN : 0750-6694
Recherche statistique d'une typologie Identifiée / Non-identifiée
SOMMAIRE
- LIMINAIRES
- 1.1. - PRÉLIMINAIRE
- 1.2. - OBJECTIFS
- 1.3. - INTRODUCTION
- LES DONNEES
- 2.1. - LES DONNÉES BRUTES
- 2.2. - CODAGE RÉVISÉ
- 2.3. - CONCLUSION
- LES CAS IDENTIFIES A POSTERIORI
- 3.1. - RÉPARTITION
- 3.2. - DESCRIPTION SOMMAIRE
- 3.3. - REPRÉSENTATION FACTORIELLE
- COMPARAISON IDENTIFIE / NON-IDENTIFIE
- 4.1. - DESCRIPTION SOMMAIRE
- 4.2. - REPRÉSENTATION FACTORIELLE
- 4.3. - REPRÉSENTATION DES OBSERVATIONS
- CONCLUSION
- PERSPECTIVES
- 6.1. - PROBLÈME
- 6.2. - MODÈLE THÉORIQUE
- 6.3. - STRATÉGIE
- 6.4. - CONCLUSION RÉFÉRENCES
ANNEXES 1 : RÈGLES DE CODAGE (VERSION 4)
ANNEXES 2 : RÉPARTITION SELON LE TYPE
ANNEXES 3 : APPROCHE THÉORIQUE
1.1. - PRÉLIMINAIRES
Cette Note Technique est la troisième abordant la description statistique des témoignages relatifs à des observations
de Phénomènes Aérospatiaux Non-identifiés ( PAN ). Il nous a paru important de préciser les objectifs
et limites de cette étude. Ces préliminaires auraient dû trouver leur place antérieurement à tout travail statistique,
mais les deux raisons ci-dessous font que des précautions élémentaires doivent être constamment réévaluées au
cours de l'analyse.
POPULATION NON-IDENTIFIÉE :
La première est spécifique à la nature des données : les outils statistiques ont essentiellement pour objectif
de décrire, résumer, tester les principaux paramètres d'une population, c'est-à-dire, par définition, d'un ensemble
d'individus * présentant une ou des caractéristiques communes.
* Élément de la population
On constate alors que la propriété commune à tous les individus définissant la population étudiée est
négative** : c'est la non-identification, par un témoin-observateur et dans un environnement particulier,
de la cause de sa perception ; elle ne définit pas une classe particulière de phénomènes mais seulement un type
de comportement ou de relations phénomène/observateur/environnement.
** Les termes positifs de la définition sont : "phénomènes" ( ce qui est perçu
par les sens ) et "aérospatiaux" mais ils sont d'une telle généralité qu'ils n'apportent guère de précision.
RECHERCHE NON INDEPENDANTE :
La deuxième raison concerne la conceptualisation du problème. D'une part le GEPAN, de par sa position et son rôle,
est un facteur actif parmi l'environnement sociologique du "phénomène OVNI" ( Cf. BESSE, ESTERLE,
JIMENEZ - 81 ) ; d'autre part, son sujet de travail n'est pas vierge mais, comme toute recherche, il a été précédé
par une série de travaux ( Cf. Notes d'Information 2, 3 et 4, Note Technique N° 3, chapitre 1 )
qui ont défini une dynamique de recherche particulière avec ses propres concepts, discours, systèmes d'hypothèses
et préjugés, par rapport auxquels il est nécessaire de se situer.
D'un point de vue général, le GEPAN ne considère pas d'hypothèse globale explicative, il ne développe que des hypothèses
ponctuelles et particulières aux situations concrètement rencontrées ( Cf. Plaquette GEPAN ). Aussi du point
de vue spécifique à l'étude statistique ceci nous conduit à reconsidérer l'héritage qui est constitué d'une part de la saisie
et du codage des informations et d'autre part des priorités accordées aux différentes analyses participant de l'approche
statistique.
Le propos de ce travail est donc double :
Achever la description statistique du fichier des observations recueillies par la Gendarmerie Nationale
entre 1974 et 1978, dans sa forme codée actuelle ; c'est la continuation des travaux entamés dans les
notes techniques 2 et 4 ; tous les cas sont maintenant codés.
Redéfinir une stratégie pour des études statistiques à venir.
1.2. – OBJECTIFS
Un premier travail statistique ( BESSE 80 ) réalisé à partir du fichier de la Gendarmerie Nationale tentait
de révéler les biais introduits dans la constitution des fichiers de données. Le travail suivant ( BESSE 81 )
insistait sur les liaisons témoins/phénomènes en faisant remarquer que deux approches et donc deux méthodologies
différentes doivent être développées suivant que l'on s'intéresse à la population des témoins ou encore à celle
des phénomènes présumés.
Le présent travail vise à décrire les caractéristiques globales de l'ensemble des phénomènes décrits dans les
procès-verbaux de la Gendarmerie, tout en sachant bien que celles-ci ont été sévèrement filtrées par les témoins*.
Les limites de cette recherche sont donc imposées par notre incapacité actuelle à pouvoir trier, parmi les caractéristiques
relevées, celles dues au témoin, celles dues au phénomène-source, celles liées aux conditions d'observation ou encore
celles attribuables à d'éventuels stéréotypes sociaux**.
* Il aurait été certainement préférable de commencer par étudier les témoins et leur perception mais l'héritage
est tel que...
** Ceux-ci sont actuellement recherchés à l'aide d'un sondage ( résultats à paraître ).
D'autre part, compte tenu de l'imprécision avec laquelle est caractérisée la population étudiée et de l'hétérogénéité
de celle-ci ( Cf. § 3 ), l'objectif principal est avant tout de rechercher une typologie des
observations. Ce n'est que lorsqu'une répartition en classes suffisamment homogènes sera obtenue que l'on pourra
envisager la recherche de modèles explicatifs pour chacune de celles-ci***.
*** Dans la revue INFORESPACE ( n° 4 hors-série, décembre 80 ), on trouve un bon exemple
montrant la nécessité d'une telle démarche. Les auteurs y étudiant la corrélation entre la fréquence journalière des
observations et la position du soleil trouvent celle-ci significativement élevée. Ils ne donnent que très peu de précisions
sur la façon dont a été construit le fichier mais tout semble indiquer qu'aucune sélection n'y a été effectuée.
Or ( Cf. § 3.1. ) les ballons sondes ou Vénus sont des sources de confusion très fréquentes
qui ont lieu justement un peu avant ou après le coucher du soleil ! Ceci suffirait peut-être à expliquer les pics importants
observés dans les distributions journalières pour le fichier considéré et ainsi les corrélations calculées.
En règle générale, il faut se méfier de ne pas attribuer à l'ensemble des observations les caractéristiques d'un sous-groupe
homogène de celles-ci.
De nombreuses classifications ont déjà été proposées dans la littérature spécialisée ( HYNECK -
SAUNDERS... ) mais toutes, extrinsèques, ont été induites sur le corpus des données et reposent essentiellement
sur un critère d'éloignement de l'observation ( voir de son "étrangeté" ). Connaissant l'imprécision de cette
estimation et l'importance que peut avoir l'environnement sur celle-ci, les classifications présentées semblent donc
concerner beaucoup plus le témoin et les conditions d'observation que le phénomène supposé à l'origine de la description.
En résumé l'objectif reste la recherche d'une typologie intrinsèque aux données en tenant compte "au mieux"
des imprécisions et écueils signalés ci-dessus. Des éléments permettant d'élaborer une stratégie de recherche plus
rigoureuse visant à intégrer les aléas du témoignage humain sont abordés au paragraphe 6.
1.3. – INTRODUCTION
Le fichier des procès-verbaux issus de la Gendarmerie est entièrement codé pour les années 74 à 78 incluses à l'exception
de quelques cas qui ont donné lieu à de très nombreux témoignages et qui seront traités à part.
Dans le deuxième paragraphe, sont posés les problèmes concernant le codage des informations afin d'aboutir à une
représentation de celles-ci excluant "au mieux" les difficultés rencontrées dans les travaux précédents.
Le but du troisième paragraphe est alors de décrire la famille des cas qui ont été identifiés a posteriori avant d'en
esquisser une typologie.
Dans le quatrième paragraphe, il s'agit de préciser la notion de "non-identification" en considérant d'abord chaque
variable puis, globalement, en étudiant la répartition des cas restant non-identifiés dans la typologie précédente.
Enfin, après une conclusion provisoire, une nouvelle approche de type probabiliste, fondée sur les résultats
de l'annexe 3, est proposée afin d'adapter codage et analyses aux problèmes très particuliers que pose l'étude
des phénomènes aérospatiaux non-identifiés.
2.1. - LES DONNÉES BRUTES
Les informations brutes contenues dans les procès-verbaux de Gendarmerie ont été résumées à l'aide du codage
détaillé par DUVAL -79 ( Cf. Annexe 1 ). Celui-ci, construit à partir de certaines idées
a priori présente des défaillances ( Cf. BESSE-81 ) lorsqu'il est confronté à la réalité des procès-verbaux
ou lors des analyses statistiques :
-
Certaines variables ont été abandonnées car jugées à l'usage inutile, trop peu significatives ou trop empreintes
de "subjectivité" :
- type d'observation,
- crédibilité,
- intérêt,
- longitude - latitude,
- estimation de l'accélération,
- direction azimutale.
-
D'autres apportent ces redondances préjudiciables à la rigueur des analyses ( une même information,
codée deux fois, prend une importance artificielle ) :
- description de la trajectoire et hauteur angulaire ( stationnement prés du sol, atterrissage... ) ( hauteur
de 0 à 15° )
- description de la trajectoire ( nulle puis lente, nulle puis rapide ) et estimation de la vitesse
( variable ).
-
Ou encore introduisent des modalités mutuellement exclusives :
- luminosité ( principale et secondaire ),
- trajectoire ( principale et secondaire ), ainsi la linéarité de la trajectoire apparaît dans une
variable ( principale ou secondaire ) mais évidemment jamais dans les deux.
Des modalités d'une même variable ne sont pas homogènes : estimation de la taille (métrique, angulaire, par comparaison).
-
Certaines sont pléthoriques et d'autres vides :
-
Trajectoire :
- ligne droite ou courbe très ample
- immobile ou ligne droite avec arrêts ( 70 % )
- objet pénétrant ou sortant de l'eau ( 1 cas )
- atterrissage puis décollage immédiat ( 2 cas )
2.2. - CODAGE RÉVISÉ
Les problèmes évoqués ci-dessus imposent de reconsidérer le codage mais comme il serait trop coûteux
de recoder tous les procès-verbaux, on se propose d'en limiter les conséquences en adaptant au mieux la structure
des variables aux analyses à réaliser. Ceci nécessite donc le regroupement de certaines modalités et, pour ce faire, la
connaissance des répartitions des observations dans les différentes variables.
Les histogrammes représentés en Annexe 2 permettent ainsi d'éliminer les modalités trop peu fréquentes et on
obtient finalement le codage ci-dessous qui sera utilisé lors des analyses factorielles décrites aux paragraphes suivants.



REMARQUES :
Ces résultats concernent 678 cas sur cinq années ( 74 à 78 ), aucune distinction n'a encore été faite
sur les types ( identifié a posteriori, non-identifié... ).
Les variables "luminosité principale et secondaire" ont été reconsidérées en une variable "intensité" et trois autres
marquent la présence ou l'absence d'un caractère ( variable, clignotant, faisceau ).
De même pour éviter les redondances possibles les variables "trajectoires principale et secondaire" sont remplacées
par la présence ou l'absence de 5 caractéristiques.
Les variables "estimation de la distance" et "estimation de la taille" sont très peu fiables. De plus, la taille est
exprimée de façon très diverse ( métrique, angulaire, qualitative, par comparaison ), elles ont été simplifiées
au maximum afin d'éviter une précision factice et donc une répartition ou dispersion non significative des observations
dans ces classes de réponses.
La redondance entre "forme ponctuelle" et "taille ponctuelle" difficilement évitable au niveau du codage sera écartée
lors des analyses.
2.3. – CONCLUSION
Les manipulations successives de l'information ne font qu'accroître l'entropie du système étudié. Seul un traitement
statistique des textes des procès-verbaux "en clair" serait susceptible de minimiser les pertes et déformations
des informations transmises par les témoins trais évidemment pour un coût nettement plus élevé.
Avant codage, chaque procès-verbal de Gendarmerie reçu au GEPAN a été expertisé par deux personnes qui classent le
cas suivant qu'il peut être :
A : explicitement identifié |
23 cas |
3,4 % |
B : probablement identifié |
153 cas |
22,6 % |
C : manque d'information |
239 cas |
35,3 % |
D : non-identifié |
263 cas |
38,8 %* |
Compte tenu du caractère limité de moyens mis en oeuvre, ces expertises ne peuvent être considérées comme
objectives mais elles apportent une Information supplémentaire ou plutôt un commentaire synthétique du procès-verbal ;
contrairement à la parcellisation systématique introduite par le codage.
* Ce ne sont pas les 20 % traditionnellement cités car le fichier considéré ici ne prend en compte
qu'un témoin jugé "principal" par cas et il ne contient pas les cas de certaines rentrées de satellites ou météorites
qui ont donné lieu à de très nombreux procès-verbaux.
3.1. – RÉPARTITION
Les 176 cas qui ont pu être explicitement identifiés ( tel avion, telle fusée, telle planète... ) ou
qui l'ont été probablement ( qui se comporte comme un avion, etc. ) conduisent à des explications très
variées :
Confusion avec des corps astronomiques :
Lune, Soleil, Vénus ou autre planète, étoiles, satellites, rentrées de satellites, de météorites ;
Confusion avec des phénomènes atmosphériques naturels :
Nuages lenticulaires, réflexion sur des nuages, traînées d'avion, gros grêlons ;
Ou encore des artéfacts :
ballons sondes, avions, hélicoptères, fusées ( météo, missiles, Tiber, éclairante ou d'artifice )
cerf-volant, engin téléguidé, pétard, montgolfière, dirigeable publicitaire, incendie, effet couronne, phares...
Ou enfin des associations de ces trois types :
planète et avion, soleil et fusée...
On remarque que parmi cette longue liste très éclectique certains phénomènes sont rares et peuvent surprendre
un observateur non averti ( effet couronne sur une ligne électrique ) mais que d'autres beaucoup plus
banals, ( lune, soleil, avion... ), ont dû être observés dans des conditions particulières ( lune
à l'horizon en partie cachée par des nuages... ) ( Voir croquis plus loin ).
Il est raisonnable de penser que cette liste est loin d'être close et cette hétérogénéité montre bien la nécessité
de déterminer une typologie des témoignages pour définir des classes présentant un minimum de cohérence.
3.2. - DESCRIPTION SOMMAIRE
En croisant la variable supplémentaire "identification" avec les autres un certain nombre de celles-ci apparaissent
comme plus discriminante :
- mois d'observation
- durée
- estimation de la taille
- luminosité
- vitesse
C'est-à-dire que ce sont ces variables qui permettent le mieux de distinguer les phénomènes les uns des autres
et donc de les identifier.
Les autres variables sont soit équiréparties suivant les types d'identification, soit trop "creuses" ( information
non disponible ) ou encore trop monolithiques ( la majorité des cas prennent la même modalité ),
par exemple :
- trajectoire : linéaire - immobile
- estimation de l'heure : la nuit
Le caractère discriminant de ces variables s'explique en fait par un certain nombre de rapprochements banals entre
des modalités de ces variables et l'identification la plus souvent associée :
VITESSE : rapide ou fulgurante pour les fusées et météorites.
DUREE : très brève, toujours pour les rentrées atmosphériques, très longue pour les planètes et étoiles.
TAILLE : ponctuelle pour les étoiles et satellites.
LUMINOSITE : les artefacts sont le plus souvent non lumineux tandis que le soleil est plus lumineux que
Vénus elle-même plus lumineuse que les autres planètes.
MOIS D'OBSERVATION :
- 27 % des confusions avec les avions ont lieu en septembre
- 37 % des confusions avec des ballons sondes ont lieu en juin
- 24 % des confusions avec les rentrées atmosphériques ont lieu en novembre
- 38 % des confusions avec Vénus ont lieu en décembre.


Planche 1

Planche 2
3.3. - REPRÉSENTATIONS FACTORIELLES
Afin d'avoir une meilleure idée d'ensemble en tenant compte des liaisons entre les variables prises deux à deux,
une analyse des correspondances multiple* a été réalisée et dont le résultat est illustré par les planches 1 et 2
précédentes.
* Cette méthode d'analyse est sommairement décrite par BESSE-80. Se reporter également
à la bibliographie citée.
-
Sur la première planche ne sont représentées que les modalités des variables "actives" qui ont participé
au calcul de l'analyse. ( recherche des axes factoriels ). Ces variables ont été choisies parmi les plus
discriminantes observées au paragraphe précédent ( le mois d'observation peu interprétable a été écarté )
et en y adjoignant deux variables ( distance et hauteur angulaire ) dont l'importance a été remarquée lors
des travaux précédents sur les cas D.
Le premier axe factoriel représente essentiellement la variable "durée de l'observation", c'est-à-dire celle qui permet le
mieux de distinguer entre eux les différents types d'observation. L'axe 1 est orienté dans le sens décroissant
des durées. La variable "estimation de la vitesse" est également liée à cet axe.
Aux vitesses estimées très rapides et fulgurantes correspondent alors les durées les plus brèves, tandis qu'à l'autre
extrémité de l'axe se trouvent représentées les modalités "lent, immobile" et "vitesse variable". On note de plus que
c'est dans le cas d'observations très brèves qu'il manque le plus d'informations.
Le deuxième axe illustre ou résume la liaison entre les variables "estimation de la distance" et "hauteur
angulaire", liaison déjà soulignée précédemment ( Cf. BESSE - 80 ) et à laquelle participe
également la variable "estimation de la taille". On retrouve donc que, grossièrement, la distance estimée par le témoin
croît avec la hauteur angulaire de l'observation à une nuance près : pour les sites les plus élevés ( 60°
à 90° ), la distance est le plus souvent non précisée. Un regroupement sommaire des modalités donne alors :
- distance en mètres - vu au sol (h. a. = 0°) - taille non ponctuelle ;
- distance en kilomètres - h. a. de 0° à 45° ;
- très grande distance - h. a. de 45° à 60° - taille ponctuelle
-
Sur la deuxième planche ont été rajoutées les modalités les plus significatives ( i.e. les plus éloignées
de l'origine ) des variables supplémentaires tandis que la structure de la représentation ( variables actives
et axes ) reste inchangée.
Ceci conduit à trois groupes de modalités qui s'étirent dans trois directions principales de dispersion :
vitesse très rapide, rouge, vert, juin, inférieure à 1 mn, pas d'information sur la taille, la vitesse ou la distance,
associées aux confusions avec des bolides et autres rentrées atmosphériques ;
lent, immobile, plus de 20 mn, très grande distance, taille ponctuelle, associées aux confusions avec Vénus
ou une étoile ;
vu au sol, distance en mètres, non lumineux, gris, métallisé, lieu désert, taille non ponctuelle, associées
à l'ensemble éclectique des phénomènes les plus rarement cités ( montgolfière, phare, canular, traînée d'avion... ).
Et enfin, on remarque un "marais statistique" c'est-à-dire l'ensemble du reste des modalités stagnant autour
de l'origine sans caractéristique déterminante. Il apparaît donc que des confusions avec certains
corps ( lune, fusée, avion, nuage ) peuvent donner lieu à des descriptions tellement variées
qu'il devient impossible de retrouver, à l'état actuel du codage, la typologie antérieure aux observations.
-
Conclusion :
Ainsi, seules trois classes apparaissent nettement dans la typologie :
les confusions avec des rentrées atmosphériques ;
les confusions avec des étoiles ou des planètes ;
un rassemblement hétéroclite de confusions avec des artéfacts.
L'information qui subsiste après témoignage et codage est insuffisante pour espérer distinguer de façon significative d'autres classes.
SUITE...
© CNES
|