CENTRE NATIONAL D'ETUDES SPATIALES

Groupe d'Etudes des Phénomènes Aérospatiaux Non-identifiés

Toulouse, le 21 avril 1980
N° 105 CT/GEPAN


 

NOTE TECHNIQUE N°2


 

Etude comparative
des résultats statistiques élémentaires
relatifs aux observations
de phénomènes aérospatiaux non identifiés




SOMMAIRE

PRÉSENTATION

INTRODUCTION

1 - DEMARCHE

1.1. Démarches générales
1.2. Description du fichier national
1.3. Comparaison des fichiers

2 - FICHIERS DES RAPPORTS DE GENDARMERIE

2.1. Présentation
2.2. Description des histogrammes

3 - COMPARAISON DES FICHIERS

3.1. Présentation
3.2. Compatibilité des codes
3.3. Comparaison

4 - CONCLUSIONS

4.1. Les fichiers
4.2. Les variables
4.3. Perspectives

BIBLIOGRAPHIE

ANNEXE




3. COMPARAISON DES FICHIERS

3.1. PRESENTATION

Deux fichiers : [Poh 76], [GMP 79] ainsi qu'occasionnellement celui de [Hen 79] sont utilisés et comparés au fichier des rapports de Gendarmerie, ceux-ci ont été constitués à des époques, à partir de sources et en des lieux différents, ils seront par la suite désignés par les codes : M, F, R, GN et A(n).

     n : le nombre d'observations considérées
     M : le fichier des obs. mondiales de [Poh 76]
     F : le fichier des obs. françaises de [Poh 76]
     R : le fichier de [GMP 79] établi en Union soviétique
     GN : le fichier contenant les rapports de la Gendarmerie
     A : le fichier de [Hen 79] construit à partir des obs. aux U.S.A.
 

3.1.1. M (825), F (220)

D'un "grand nombre de sources choisies au hasard", (cf [Poh 76]) 200 livres et revues publiées en langue française ou anglaise, ont été extraits et codés 1000 témoignages. Les cas douteux ou ceux pouvant s'identifier à des phénomènes connus ( bolide, ballon-sonde,...) ont été éliminés, les observations multiples regroupées en un seul cas. L'étude statistique a alors été entreprise sur les 825 cas restants, ainsi que sur les 220 cas français extraits des précédents. Ces deux fichiers ne pouvant être considérés comme indépendants ( l'un contient l'autre ), seul M(825) est utilisé dans les tests.

3.1.2. R(256)

256 observations issues de 207 rapports sont considérées en [GMP 79]. Peu d'indications sont données sur les critères de sélection utilisés, sinon que les cas ont été collectés par F.J. ZIGUEL. Certains éléments laissent penser que l'épuration a été moins sévère que pour les autres fichiers (cf. 3.3.). D'autre part, l'individu de base, pour les variables descriptives est "l'objet" et pour les observations en dénombrant plusieurs, chacun de ceux-ci figure dans le comptage. Sur les graphes, se superposent deux résultats ( avec ou sans redondance ) prenant en compte, soit une, soit plusieurs fois, les observations ayant donné lieu à plusieurs témoignages indépendants. Sur ce point, la compatibilité des fichiers est assurée.

3.1.3. GN (188)

Celui-ci apparaît comme le plus riche c'est à dire que les cas où l'information n'est pas disponible sont moins nombreux. Comme il est expliqué précédemment, seul est retenu le témoignage principal ( le plus détaillé ).

3.1.4. A(113)

Ce fichier, constitué et vérifié par l'auteur, est utilisé pour compléter la documentation de trois variables ( heure locale, durée, témoins potentiels ).

3.2. COMPATIBILITÉ DES CODES

C'est le premier problème qui se pose. Ainsi, dans M(825) et R(256) les témoins sont classés par "compétence" alors que GN(188) utilise les catégories socio-professionnelles de l'INSEE. Cette variable n'est guère utilisable, elle montre juste que les objectifs des auteurs étaient différents. Pour les variables descriptives des observations, la difficulté vient de ce que les modalités de ces variables ont été définies en fonction du contenu des rapports et reflètent leur imprécision. Inversement, on peut dire que la relative compatibilité des systèmes de collage, même si on ne peut pas les supposer indépendants, témoigne, sans une certaine mesure, d'une cohérence dans la perception des phénomènes.

3.3. COMPARAISON

Le tableau n°1 donne schématiquement les possibilités de comparer les variables. L'influence possible de la sélection des observations est prise en compte dans les interprétations proposées pour expliciter les ressemblances ou dissemblances des histogrammes.

Lorsque les similitudes sont importantes, le test du X² est alors employé dans le cadre suivant :

     

"La population parente considérée est l'ensemble des cas dont le témoignage est connu : soit par la presse, les livres ou revues spécialisées, soit par un canal officiel ( rapport de gendarmerie )".

 

  CRITERES     0     1     2     3  
Année de l'observation     X      
Mois de l'observation     X      
Heure locale       X    
Météo       X    
Nombre de témoins       X    
  Catégorie socio-prof.      X        
Age       X    
Durée       X     X  
Distance       X    
Nombre d'objets       X    
Forme     X      
Luminosité     X      
Couleur     X      
Trajectoire     X      
Vitesse     X      
Accélération   X        
Bruit       X    
Dimension   X        
           0 : codes incompatibles
1 : histogrammes différents
2 : histogrammes semblables
3 : test d'homogénéité positif

TABLEAU N°1 : Tableau comparatif sur les fichiers

Le choix s'impose pour deux raisons :

  • Tant que restent inconnues les motivations incitant un observateur à témoigner, la population totale des observations, ou pire celle des phénomènes, ne peut être considérée ;
  • Comme les fichiers privilégient certaines sources, le pôle : canal de transfert, n'est pas prix en compte pour définir l'individu de base qui se compose donc des pôles :
    phénomène / témoin / témoignage / environnement.

On suppose de plus que les fichiers sont des échantillons aléatoires et indépendants entre eux. Si l'indépendance parait admissible, le caractère aléatoire de l'échantillonnage semble plus sujet à caution et doit être discuté suivant la variable considérée. Certaines variables apparaissent plus biaisées que d'autres.

REMARQUE :
Le pourcentage des "non disponibles" n'est en général représenté que pour le fichier GN car, restant modéré, il ne nuit pas, comme pour les autres fichiers, à la lisibilité des histogrammes.

3.3.1. LOCALISATION

  • Année de l'observation :
    Les fichiers concernent des époques différentes. Ils se divisent en deux sous-populations :
    • o Autour de la vague de 1954,
    • o Années courantes 1964-70.
    R étudie essentiellement une vague en 1967, GN des années courantes entre 1974 et 1978.

  •  
  • Mois de l'observation :
    Les différences dans l'aspect aléatoire de la distribution sont dues à l'influence des vagues ( octobre 54 pour F et M, et 1967 pour R, mars 74 pour GN ) qui sont encore loin de pouvoir être interprétées (cf [Hen 79]).

  •  
  • Heure locale :
    Le fait que les phénomènes lumineux se remarquent mieux la nuit, associé à la disponibilité des observateurs potentiels, explique la relative stabilité des fréquences observées.

On considére la population des observations connues dont on suppose que Ies fichiers représentent des échantillons aléatoires indépendants. Ceci revient à faire l'hypothèse que les différents modes de collecte ou de sélection sont sans influence sur la variable "heure locale".

Le test d'homogénéité (niveau 5 %) donne alors les résultats suivants :

ECHANTILLONS Kn au X² observé Nbre de degrés de liberté X² limité à 5 %
M, R, GN    74,54 30 43,77
M, R 48,84 15 25,00
R, GN 37,69 15 25,00
M, GN 25,85 15 25,00

 

REMARQUES :
Les classes d'effectif trop faibles sont regroupées afin que les effectifs soient toujours supérieurs ou égaux à 5.

Tous les tests sont négatifs au niveau choisi, mais au sens de la distance du X², les fichiers M et GN sont voisins relativement à R.




 

3.3.2. CONDITIONS D'OBSERVATIONS ET ASPECTS SOCIOLOGIQUES

  • Météo :
    Pour tous les fichiers, les possibilités d'observation décroissent avec la nébulosité.

  • Nombre de témoins :
    C'est la variable où les biais imposés par le canal de transfert de l'information apparaissent le plus clairement : seul le fichier R contient un nombre important d'observations de masse qui, pour certaines, ayant toutes les apparences d'observations astronomiques ( planète, bolides ) ont dû être éliminées à l'expertise des autres fichiers.

    Comparativement aux autres fichiers, il semble que seule une partie des témoins isolés se décident à déposer à la Gendarmerie.

  • Témoins potentiels :
    Cette variable n'est disponible que pour deux fichiers (GN et A) et ses modalités étant imprécises, la comparaison ne peut être que grossière. Toutefois, il semble bien encore que les témoins isolés, supposés plus fréquents dans les zones peu peuplées, sont, comme ci-dessus, proportionnellement plus rares dans le fichier GN.

  • Catégorie socio-professionnelle :
    Inexploitable.

  • Age :
    Comme pour les témoins isolés, les témoins jeunes semblent rebutés par la Gendarmerie. Le test du X² conduit à réfuter l'hypothèse d'homogénéité entre les fichiers M et GN ( Kn = 15,87 tandis que le seuil est de 7,82 ).

  • Durée :
    En se plaçant sous les mêmes hypothèses que pour la variable "heure locale", les tests fournissent les résultats suivants :

    ECHANTILLONS Kn au X² observé Nbre de degrés de liberté X² limité au 5 %
    M, R, GN, A 26,29 12 21,03
    R, GN, A 7,68 8 15,51
    R, GN
    (distribution détaillées)
    5,37 7 14,07

    Ces résultats conduisent, sauf pour le fichier M, à accepter les hypothèses d'homogénéité. L'interprétation de cette stabilité fait intervenir le comportement du témoin (cf [Hen 79] p 249), elle ne peut être entreprise ici.

  • Distance :
    Par manque d'information, le fichier R est peu explicite sur cette variable puisque seulement 12 observateurs (5 %) ont fourni une estimation de la distance. On remarque surtout un pourcentage important d'observations éloignées dans les fichiers M et F sans pouvoir l'expliquer de façon satisfaisante.


 









3.3.3. DESCRIPTION DE L'OBSERVATION

  • Nombre d'objets :
    Importance semble t-il assez généralisée d'observations d'un phénomène connexe.

    Les autres variables décrivant des facteurs qualitatifs, la comparaison des fichiers devient très approximative compte tenu de l'imprécision de la définition des modalités.

  • Forme :
    On note surtout un nombre comparativement important de phénomènes ponctuels en R.

  • Luminosité :
    R.A.S.

  • Couleur :
    R est ici inutilisable car, contrairement aux autres fichiers, les phénomènes présentant plusieurs couleurs sont comptés autant de fois qu'il y a de couleurs. La relative homogénéité entre M et F peut être due au fait que M contient F. La faible proportion de phénomènes "métallisés" dans GN semble être la différence la plus remarquable.

  • Trajectoire - Vitesse :
    Deux remarques sur ces variables :

    • Le fichier R ne contient pas "d'atterrissage",
    • Les fichiers M et F relatent comparativement beaucoup moins de trajectoires régulières.
      Ceci peut s'expliquer de deux façons :
      • Claude POHER a favorisé, dans la sélection, les rapports étranges,
      • Les sources sont constituées de documents secondaires ( livres, revues ). Les exemples sont nombreux dans la vague de 54 où, remontant au témoin de l'observation, celui-ci nie les arabesques ou trajectoires brisées annoncées dans la presse.
  • Bruit :
    Importance générale du caractère silencieux des observations.

 











SUITE...




© CNES