CENTRE NATIONAL D'ETUDES SPATIALES

Groupe d'Etudes des Phénomènes Aérospatiaux Non-identifiés

Toulouse, le 26 novembre 1982
N° 0148 CT/GEPAN


 

NOTE TECHNIQUE
N° 13


 

RECHERCHE STATISTIQUE D'UNE TYPOLOGIE
IDENTIFIEE / NON-IDENTIFIEE

 

 

ISSN : 0750-6694




Recherche statistique d'une typologie
Identifiée / Non-identifiée

 

SOMMAIRE

  1. - LIMINAIRES

    • 1.1. - PRÉLIMINAIRE
    • 1.2. - OBJECTIFS
    • 1.3. - INTRODUCTION

  2. - LES DONNEES

    • 2.1. - LES DONNÉES BRUTES
    • 2.2. - CODAGE RÉVISÉ
    • 2.3. - CONCLUSION

  3. - LES CAS IDENTIFIES A POSTERIORI

    • 3.1. - RÉPARTITION
    • 3.2. - DESCRIPTION SOMMAIRE
    • 3.3. - REPRÉSENTATION FACTORIELLE

  4. - COMPARAISON IDENTIFIE / NON-IDENTIFIE

    • 4.1. - DESCRIPTION SOMMAIRE
    • 4.2. - REPRÉSENTATION FACTORIELLE
    • 4.3. - REPRÉSENTATION DES OBSERVATIONS

  5. - CONCLUSION

  6. - PERSPECTIVES

    • 6.1. - PROBLÈME
    • 6.2. - MODÈLE THÉORIQUE
    • 6.3. - STRATÉGIE
    • 6.4. - CONCLUSION RÉFÉRENCES

ANNEXES 1 : RÈGLES DE CODAGE (VERSION 4)

ANNEXES 2 : RÉPARTITION SELON LE TYPE

ANNEXES 3 : APPROCHE THÉORIQUE

 




 

1. - LIMINAIRES

 

1.1. - PRÉLIMINAIRES

Cette Note Technique est la troisième abordant la description statistique des témoignages relatifs à des observations de Phénomènes Aérospatiaux Non-identifiés ( PAN ). Il nous a paru important de préciser les objectifs et limites de cette étude. Ces préliminaires auraient dû trouver leur place antérieurement à tout travail statistique, mais les deux raisons ci-dessous font que des précautions élémentaires doivent être constamment réévaluées au cours de l'analyse.

POPULATION NON-IDENTIFIÉE :

La première est spécifique à la nature des données : les outils statistiques ont essentiellement pour objectif de décrire, résumer, tester les principaux paramètres d'une population, c'est-à-dire, par définition, d'un ensemble d'individus * présentant une ou des caractéristiques communes.

* Élément de la population

On constate alors que la propriété commune à tous les individus définissant la population étudiée est négative** : c'est la non-identification, par un témoin-observateur et dans un environnement particulier, de la cause de sa perception ; elle ne définit pas une classe particulière de phénomènes mais seulement un type de comportement ou de relations phénomène/observateur/environnement.

** Les termes positifs de la définition sont : "phénomènes" ( ce qui est perçu par les sens ) et "aérospatiaux" mais ils sont d'une telle généralité qu'ils n'apportent guère de précision.

RECHERCHE NON INDEPENDANTE :

La deuxième raison concerne la conceptualisation du problème. D'une part le GEPAN, de par sa position et son rôle, est un facteur actif parmi l'environnement sociologique du "phénomène OVNI" ( Cf. BESSE, ESTERLE, JIMENEZ - 81 ) ; d'autre part, son sujet de travail n'est pas vierge mais, comme toute recherche, il a été précédé par une série de travaux ( Cf. Notes d'Information 2, 3 et 4, Note Technique N° 3, chapitre 1 ) qui ont défini une dynamique de recherche particulière avec ses propres concepts, discours, systèmes d'hypothèses et préjugés, par rapport auxquels il est nécessaire de se situer.

D'un point de vue général, le GEPAN ne considère pas d'hypothèse globale explicative, il ne développe que des hypothèses ponctuelles et particulières aux situations concrètement rencontrées ( Cf. Plaquette GEPAN ). Aussi du point de vue spécifique à l'étude statistique ceci nous conduit à reconsidérer l'héritage qui est constitué d'une part de la saisie et du codage des informations et d'autre part des priorités accordées aux différentes analyses participant de l'approche statistique.

Le propos de ce travail est donc double :

  • Achever la description statistique du fichier des observations recueillies par la Gendarmerie Nationale entre 1974 et 1978, dans sa forme codée actuelle ; c'est la continuation des travaux entamés dans les notes techniques 2 et 4 ; tous les cas sont maintenant codés.

  • Redéfinir une stratégie pour des études statistiques à venir.

 

1.2. – OBJECTIFS

Un premier travail statistique ( BESSE 80 ) réalisé à partir du fichier de la Gendarmerie Nationale tentait de révéler les biais introduits dans la constitution des fichiers de données. Le travail suivant ( BESSE 81 ) insistait sur les liaisons témoins/phénomènes en faisant remarquer que deux approches et donc deux méthodologies différentes doivent être développées suivant que l'on s'intéresse à la population des témoins ou encore à celle des phénomènes présumés.

Le présent travail vise à décrire les caractéristiques globales de l'ensemble des phénomènes décrits dans les procès-verbaux de la Gendarmerie, tout en sachant bien que celles-ci ont été sévèrement filtrées par les témoins*. Les limites de cette recherche sont donc imposées par notre incapacité actuelle à pouvoir trier, parmi les caractéristiques relevées, celles dues au témoin, celles dues au phénomène-source, celles liées aux conditions d'observation ou encore celles attribuables à d'éventuels stéréotypes sociaux**.

* Il aurait été certainement préférable de commencer par étudier les témoins et leur perception mais l'héritage est tel que...

** Ceux-ci sont actuellement recherchés à l'aide d'un sondage ( résultats à paraître ).

D'autre part, compte tenu de l'imprécision avec laquelle est caractérisée la population étudiée et de l'hétérogénéité de celle-ci ( Cf. § 3 ), l'objectif principal est avant tout de rechercher une typologie des observations. Ce n'est que lorsqu'une répartition en classes suffisamment homogènes sera obtenue que l'on pourra envisager la recherche de modèles explicatifs pour chacune de celles-ci***.

*** Dans la revue INFORESPACE ( n° 4 hors-série, décembre 80 ), on trouve un bon exemple montrant la nécessité d'une telle démarche. Les auteurs y étudiant la corrélation entre la fréquence journalière des observations et la position du soleil trouvent celle-ci significativement élevée. Ils ne donnent que très peu de précisions sur la façon dont a été construit le fichier mais tout semble indiquer qu'aucune sélection n'y a été effectuée. Or ( Cf. § 3.1. ) les ballons sondes ou Vénus sont des sources de confusion très fréquentes qui ont lieu justement un peu avant ou après le coucher du soleil ! Ceci suffirait peut-être à expliquer les pics importants observés dans les distributions journalières pour le fichier considéré et ainsi les corrélations calculées.
En règle générale, il faut se méfier de ne pas attribuer à l'ensemble des observations les caractéristiques d'un sous-groupe homogène de celles-ci.

De nombreuses classifications ont déjà été proposées dans la littérature spécialisée ( HYNECK - SAUNDERS... ) mais toutes, extrinsèques, ont été induites sur le corpus des données et reposent essentiellement sur un critère d'éloignement de l'observation ( voir de son "étrangeté" ). Connaissant l'imprécision de cette estimation et l'importance que peut avoir l'environnement sur celle-ci, les classifications présentées semblent donc concerner beaucoup plus le témoin et les conditions d'observation que le phénomène supposé à l'origine de la description.

En résumé l'objectif reste la recherche d'une typologie intrinsèque aux données en tenant compte "au mieux" des imprécisions et écueils signalés ci-dessus. Des éléments permettant d'élaborer une stratégie de recherche plus rigoureuse visant à intégrer les aléas du témoignage humain sont abordés au paragraphe 6.

 

1.3. – INTRODUCTION

Le fichier des procès-verbaux issus de la Gendarmerie est entièrement codé pour les années 74 à 78 incluses à l'exception de quelques cas qui ont donné lieu à de très nombreux témoignages et qui seront traités à part.

Dans le deuxième paragraphe, sont posés les problèmes concernant le codage des informations afin d'aboutir à une représentation de celles-ci excluant "au mieux" les difficultés rencontrées dans les travaux précédents.

Le but du troisième paragraphe est alors de décrire la famille des cas qui ont été identifiés a posteriori avant d'en esquisser une typologie.

Dans le quatrième paragraphe, il s'agit de préciser la notion de "non-identification" en considérant d'abord chaque variable puis, globalement, en étudiant la répartition des cas restant non-identifiés dans la typologie précédente.

Enfin, après une conclusion provisoire, une nouvelle approche de type probabiliste, fondée sur les résultats de l'annexe 3, est proposée afin d'adapter codage et analyses aux problèmes très particuliers que pose l'étude des phénomènes aérospatiaux non-identifiés.

 

2. - LES DONNÉES

 

2.1. - LES DONNÉES BRUTES

Les informations brutes contenues dans les procès-verbaux de Gendarmerie ont été résumées à l'aide du codage détaillé par DUVAL -79 ( Cf. Annexe 1 ). Celui-ci, construit à partir de certaines idées a priori présente des défaillances ( Cf. BESSE-81 ) lorsqu'il est confronté à la réalité des procès-verbaux ou lors des analyses statistiques :

  • Certaines variables ont été abandonnées car jugées à l'usage inutile, trop peu significatives ou trop empreintes de "subjectivité" :

    • type d'observation,
    • crédibilité,
    • intérêt,
    • longitude - latitude,
    • estimation de l'accélération,
    • direction azimutale.

    •  
  • D'autres apportent ces redondances préjudiciables à la rigueur des analyses ( une même information, codée deux fois, prend une importance artificielle ) :

    • description de la trajectoire et hauteur angulaire ( stationnement prés du sol, atterrissage... ) ( hauteur de 0 à 15° )
    • description de la trajectoire ( nulle puis lente, nulle puis rapide ) et estimation de la vitesse ( variable ).

    •  
  • Ou encore introduisent des modalités mutuellement exclusives :

    • luminosité ( principale et secondaire ),
    • trajectoire ( principale et secondaire ), ainsi la linéarité de la trajectoire apparaît dans une variable ( principale ou secondaire ) mais évidemment jamais dans les deux.

    •  
  • Des modalités d'une même variable ne sont pas homogènes : estimation de la taille (métrique, angulaire, par comparaison).

  • Certaines sont pléthoriques et d'autres vides :

    • Trajectoire :
      • ligne droite ou courbe très ample
      • immobile ou ligne droite avec arrêts ( 70 % )
      • objet pénétrant ou sortant de l'eau ( 1 cas )
      • atterrissage puis décollage immédiat ( 2 cas )

 

2.2. - CODAGE RÉVISÉ

Les problèmes évoqués ci-dessus imposent de reconsidérer le codage mais comme il serait trop coûteux de recoder tous les procès-verbaux, on se propose d'en limiter les conséquences en adaptant au mieux la structure des variables aux analyses à réaliser. Ceci nécessite donc le regroupement de certaines modalités et, pour ce faire, la connaissance des répartitions des observations dans les différentes variables.

Les histogrammes représentés en Annexe 2 permettent ainsi d'éliminer les modalités trop peu fréquentes et on obtient finalement le codage ci-dessous qui sera utilisé lors des analyses factorielles décrites aux paragraphes suivants.

 

 

REMARQUES :

  • Ces résultats concernent 678 cas sur cinq années ( 74 à 78 ), aucune distinction n'a encore été faite sur les types ( identifié a posteriori, non-identifié... ).

  • Les variables "luminosité principale et secondaire" ont été reconsidérées en une variable "intensité" et trois autres marquent la présence ou l'absence d'un caractère ( variable, clignotant, faisceau ).

  • De même pour éviter les redondances possibles les variables "trajectoires principale et secondaire" sont remplacées par la présence ou l'absence de 5 caractéristiques.

  • Les variables "estimation de la distance" et "estimation de la taille" sont très peu fiables. De plus, la taille est exprimée de façon très diverse ( métrique, angulaire, qualitative, par comparaison ), elles ont été simplifiées au maximum afin d'éviter une précision factice et donc une répartition ou dispersion non significative des observations dans ces classes de réponses.

  • La redondance entre "forme ponctuelle" et "taille ponctuelle" difficilement évitable au niveau du codage sera écartée lors des analyses.

 

2.3. – CONCLUSION

Les manipulations successives de l'information ne font qu'accroître l'entropie du système étudié. Seul un traitement statistique des textes des procès-verbaux "en clair" serait susceptible de minimiser les pertes et déformations des informations transmises par les témoins trais évidemment pour un coût nettement plus élevé.

 

3. - LES CAS IDENTIFIES A POSTERIORI

 

Avant codage, chaque procès-verbal de Gendarmerie reçu au GEPAN a été expertisé par deux personnes qui classent le cas suivant qu'il peut être :

  A : explicitement identifié     23 cas      3,4 %  
  B : probablement identifié    153 cas    22,6 %
  C : manque d'information  239 cas    35,3 %
  D : non-identifié  263 cas    38,8 %*

Compte tenu du caractère limité de moyens mis en oeuvre, ces expertises ne peuvent être considérées comme objectives mais elles apportent une Information supplémentaire ou plutôt un commentaire synthétique du procès-verbal ; contrairement à la parcellisation systématique introduite par le codage.

* Ce ne sont pas les 20 % traditionnellement cités car le fichier considéré ici ne prend en compte qu'un témoin jugé "principal" par cas et il ne contient pas les cas de certaines rentrées de satellites ou météorites qui ont donné lieu à de très nombreux procès-verbaux.

 

3.1. – RÉPARTITION

Les 176 cas qui ont pu être explicitement identifiés ( tel avion, telle fusée, telle planète... ) ou qui l'ont été probablement ( qui se comporte comme un avion, etc. ) conduisent à des explications très variées :

  • Confusion avec des corps astronomiques :
    Lune, Soleil, Vénus ou autre planète, étoiles, satellites, rentrées de satellites, de météorites ;

  • Confusion avec des phénomènes atmosphériques naturels :
    Nuages lenticulaires, réflexion sur des nuages, traînées d'avion, gros grêlons ;

  • Ou encore des artéfacts :
    ballons sondes, avions, hélicoptères, fusées ( météo, missiles, Tiber, éclairante ou d'artifice ) cerf-volant, engin téléguidé, pétard, montgolfière, dirigeable publicitaire, incendie, effet couronne, phares...

  • Ou enfin des associations de ces trois types :
    planète et avion, soleil et fusée...

On remarque que parmi cette longue liste très éclectique certains phénomènes sont rares et peuvent surprendre un observateur non averti ( effet couronne sur une ligne électrique ) mais que d'autres beaucoup plus banals, ( lune, soleil, avion... ), ont dû être observés dans des conditions particulières ( lune à l'horizon en partie cachée par des nuages... ) ( Voir croquis plus loin ).

Il est raisonnable de penser que cette liste est loin d'être close et cette hétérogénéité montre bien la nécessité de déterminer une typologie des témoignages pour définir des classes présentant un minimum de cohérence.

 

3.2. - DESCRIPTION SOMMAIRE

En croisant la variable supplémentaire "identification" avec les autres un certain nombre de celles-ci apparaissent comme plus discriminante :

  • mois d'observation
  • durée
  • estimation de la taille
  • luminosité
  • vitesse

C'est-à-dire que ce sont ces variables qui permettent le mieux de distinguer les phénomènes les uns des autres et donc de les identifier.

Les autres variables sont soit équiréparties suivant les types d'identification, soit trop "creuses" ( information non disponible ) ou encore trop monolithiques ( la majorité des cas prennent la même modalité ), par exemple :

  • trajectoire : linéaire - immobile
  • estimation de l'heure : la nuit

Le caractère discriminant de ces variables s'explique en fait par un certain nombre de rapprochements banals entre des modalités de ces variables et l'identification la plus souvent associée :

  • VITESSE : rapide ou fulgurante pour les fusées et météorites.

  • DUREE : très brève, toujours pour les rentrées atmosphériques, très longue pour les planètes et étoiles.

  • TAILLE : ponctuelle pour les étoiles et satellites.

  • LUMINOSITE : les artefacts sont le plus souvent non lumineux tandis que le soleil est plus lumineux que Vénus elle-même plus lumineuse que les autres planètes.

  • MOIS D'OBSERVATION :

    • 27 % des confusions avec les avions ont lieu en septembre
    • 37 % des confusions avec des ballons sondes ont lieu en juin
    • 24 % des confusions avec les rentrées atmosphériques ont lieu en novembre
    • 38 % des confusions avec Vénus ont lieu en décembre.

 

Planche 1

 

Planche 2

 

3.3. - REPRÉSENTATIONS FACTORIELLES

Afin d'avoir une meilleure idée d'ensemble en tenant compte des liaisons entre les variables prises deux à deux, une analyse des correspondances multiple* a été réalisée et dont le résultat est illustré par les planches 1 et 2 précédentes.

* Cette méthode d'analyse est sommairement décrite par BESSE-80. Se reporter également à la bibliographie citée.

  1. Sur la première planche ne sont représentées que les modalités des variables "actives" qui ont participé au calcul de l'analyse. ( recherche des axes factoriels ). Ces variables ont été choisies parmi les plus discriminantes observées au paragraphe précédent ( le mois d'observation peu interprétable a été écarté ) et en y adjoignant deux variables ( distance et hauteur angulaire ) dont l'importance a été remarquée lors des travaux précédents sur les cas D.

    Le premier axe factoriel représente essentiellement la variable "durée de l'observation", c'est-à-dire celle qui permet le mieux de distinguer entre eux les différents types d'observation. L'axe 1 est orienté dans le sens décroissant des durées. La variable "estimation de la vitesse" est également liée à cet axe.

    Aux vitesses estimées très rapides et fulgurantes correspondent alors les durées les plus brèves, tandis qu'à l'autre extrémité de l'axe se trouvent représentées les modalités "lent, immobile" et "vitesse variable". On note de plus que c'est dans le cas d'observations très brèves qu'il manque le plus d'informations.

    Le deuxième axe illustre ou résume la liaison entre les variables "estimation de la distance" et "hauteur angulaire", liaison déjà soulignée précédemment ( Cf. BESSE - 80 ) et à laquelle participe également la variable "estimation de la taille". On retrouve donc que, grossièrement, la distance estimée par le témoin croît avec la hauteur angulaire de l'observation à une nuance près : pour les sites les plus élevés ( 60° à 90° ), la distance est le plus souvent non précisée. Un regroupement sommaire des modalités donne alors :

    • distance en mètres - vu au sol (h. a. = 0°) - taille non ponctuelle ;
    • distance en kilomètres - h. a. de 0° à 45° ;
    • très grande distance - h. a. de 45° à 60° - taille ponctuelle

  2. Sur la deuxième planche ont été rajoutées les modalités les plus significatives ( i.e. les plus éloignées de l'origine ) des variables supplémentaires tandis que la structure de la représentation ( variables actives et axes ) reste inchangée.

    Ceci conduit à trois groupes de modalités qui s'étirent dans trois directions principales de dispersion :

    • vitesse très rapide, rouge, vert, juin, inférieure à 1 mn, pas d'information sur la taille, la vitesse ou la distance, associées aux confusions avec des bolides et autres rentrées atmosphériques ;

    • lent, immobile, plus de 20 mn, très grande distance, taille ponctuelle, associées aux confusions avec Vénus ou une étoile ;

    • vu au sol, distance en mètres, non lumineux, gris, métallisé, lieu désert, taille non ponctuelle, associées à l'ensemble éclectique des phénomènes les plus rarement cités ( montgolfière, phare, canular, traînée d'avion... ).

    Et enfin, on remarque un "marais statistique" c'est-à-dire l'ensemble du reste des modalités stagnant autour de l'origine sans caractéristique déterminante. Il apparaît donc que des confusions avec certains corps ( lune, fusée, avion, nuage ) peuvent donner lieu à des descriptions tellement variées qu'il devient impossible de retrouver, à l'état actuel du codage, la typologie antérieure aux observations.

  3. Conclusion :

    Ainsi, seules trois classes apparaissent nettement dans la typologie :

    • les confusions avec des rentrées atmosphériques ;

    • les confusions avec des étoiles ou des planètes ;

    • un rassemblement hétéroclite de confusions avec des artéfacts.

L'information qui subsiste après témoignage et codage est insuffisante pour espérer distinguer de façon significative d'autres classes.

 

 

 




SUITE...




© CNES