CENTRE NATIONAL D'ETUDE SPATIALES

Groupe d'Etude des Phénomènes Aérospatiaux Non-identifiés

Toulouse, le 29 octobre 1979

NOTE TECHNIQUE N°1


 

Analyse du problème
du pré-traitement des données




SOMMAIRE

PRÉSENTATION

CHAPITRE 1 - Les techniques d'expertise

( Alain ESTERLE )

CHAPITRE 2 - Règles de codage ( 4ème version GEPAN )

( Jacques DUVAL )

CHAPITRE 3 - Rapport d'études statistiques

( Paul LEGENDRE )

CHAPITRE 4 - Réflexion sur les principes du pre-traitement

( Manuel JIMENEZ )

CHAPITRE 5 - Etude des problèmes liés à la création d'un fichier informatique

( Jean-Pierre ROSPARS )

CHAPITRE 6 - Les méthodes de traitement de I'information appliquées aux phénomènes OVNI

( Michel MARCUS )

CONCLUSION




CHAPITRE 3

RAPPORT D'ÉTUDES STATISTIQUES

Note technique faite sur proposition du Pr. DURANDIN et de Mme ASKEVIS.
Travaux développés par Paul LEGENDRE.

RESUME

Un ensemble de 106 rapports d'observation classés dans la rubrique D formée des rapports pour lesquels il n'est pas possible, malgré les détails décrits, d'identifier le phénomène observé, a servi de base à la constitution d'une première version du fichier national d'observation. Ces observations ont eu lieu, dans leur majorité, durant les années 1974 à 1977. Seulement 9 rapports sont antérieurs à cette période. Les rapports proviennent tous de la Gendarmerie Nationale.

A partir des variables psycho-sociologiques codées dans le fichier, nous avons tenté de faire une analyse statistique. Cette note en présente les résultats.

1. LES VARIABLES PSYCHO-SOCIALES

Dans le code retenu ( annexe 21 du rapport de juin 1978 au Conseil Scientifique ), figurent les variables suivantes :

  • département du lieu d'observation,
  • nombre de témoins,
  • profession du témoin principal
  • âge du témoin principal.

Le dépouillement relatif à ces variables fournit les résultats consignée dans les paragraphes ci-dessous ( le codage utilisé correspond à celui décrit clans la note n° 143/CT/GEPAN du 2 juin 1978 ).

1.1. DÉPARTEMENT DU LIEU D'OBSERVATION

Nbre de rapports Département (code postal) Effectif (Nbre Dépt) Effectif théorique (*)
5 59. 1 10,5
4 21.54.76.82. 4
3 13.28.34.38.45.51.85 7
2 02.08.11.17.24.33.39.47.52.55.60.62. 68.71.80.83 16 21,5
1 04. 07. 09. 10. 15. 16. 19. 23. 25. 26. 29. 30. 32. 35. 42. 46. 50. 53. 57. 61. 64. 66. 69. 72. 73. 79. 84. 86. 88. 89. 30 39
0 01. 03. 05. 06. 12. 14. 18. 20A. 20B. 22. 27. 31. 36. 37. 40. 41. 43. 44. 48. 49. 56. 58. 63. 67. 70. 74. 77. 81. 87. 90. 75. 78. 91. 92. 93. 94. 95. 65. 37 35

Plus deux rapporta provenant des territoires d'outre-mer français.
(*) : distribution aléatoire avec même probabilité pour chaque département.

La distribution de l'effectif par nombre de rapports ne diffère pas significativement de la distribution théorique correspondant à l'hypothèse d'une distribution uniforme ( X2 = 3,81 avec 3 d.d.l ).

1.2. NOMBRE DE TEMOINS

L'histogramme est :

Nombre de témoins Nombre de rapports
1 21
2 28
3 23
4 - 5 17
5 15
Non mentionné 2

L'effectif de la classe "1 seul témoin" est vraisemblablement sous-représenté dans la mesure où la présence de plusieurs témoins peut être un facteur incitant les "experts" à placer une telle observation dans la catégorie D. On retrouve cependant l'estimation de POHER ( rapport du Conseil Scientifique de décembre 77 ) :

  • "70 % des observations ont au moins 2 témoins et plus de 50 % des observations ont au moins 3 témoins ".

1.3..PROFESSION DU TEMOIN PRINCIPAL

Compte tenu du faible effectif global, nous n'avons retenu que la classification par groupes socio-professionnels ( 1er chiffre de la classification INSEE ).

Groupe SOCIO-PROFESSIONNEL DU TÉMOIN PRINCIPAL EFFECTIF
0 - Agriculteurs exploitants 12
1 - Salariés agricoles 2
2 - Patrons de l'industrie et du commerce 9
3 - Professions libérales et cadres supérieurs 4
4 - Cadres moyens 7
5 - Employés 6
6 - Ouvriers 24
7 - Personnel de service 7
8 - Autres catégories ( en fait : Armées - Police ) 11
9 - Personnes non actives 21
     Non mentionné 3

Il est possible de détailler le groupe 6 :

6 - Ouvriers : 24
    60. Contremaîtres 4
    61. Ouvriers qualifiés 7
    63. Ouvriers spécialisés 10
    67. Apprentis ouvriers 3
    68. Manœuvres -

Il est possible de détailler le groupe 9 :

9 - Personnes non actives :  21
    91. Etudiants et élèves de 17 ans et plus 1
    92. Militaires du contingent 2
    93. Anciens agriculteurs -
    94. Retirés des affaires -
    95. Retraités du secteur public 5
    96. Anciens salariés du secteur privé -
    97. Autre personnes non actives de - 17 ans 6
    98. Autre personnes non actives de 17 à 64 ans 4
    97. Autre personnes non actives de + 64 ans 3

Ces données permettent de reprendre la conclusion de C. POHER :

  • "un très large éventail de professions existe parmi les témoins".

On peut cependant préciser quelques points en comparant cet effectif à l'effectif théorique obtenu à partir de l'importance numérique de chaque groupe. Nous ne disposons de ces données que pour les catégories 0 à 8 ( référence : recensement 1975 ).

Groupe socio-prof. Nombre de personnes Effectif théorique de rapports Effectif constaté
0 - 1 2 026 315 7.6 14
2 1 708 925 6.4 9
3 1 459 285 5.5 1
4 2 764 950 10.4 7
5 3 841 255 14.5 6
6 8 207 165 30.9 24
7 1 242 935 4.7 7
8 (*) 357 980 2 11

(*) armée et police exclusivement.

Deux groupes sont sur-représentés :

  • - agriculteurs exploitants et salariés agricoles,
  • - armée - police,

et un groupe sous-représenté :

  • - employés.

Les différences sont significatives au seuil 0.025. La sur-représentation du groupe "armée-police" peut s'expliquer par le fait que nous travaillons exclusivement sur des rapports de gendarmerie et que les personnes de ce groupe sont plus prêtes à aller témoigner. A moins que cela ne résulte de l'expertise : cette catégorie apparaissant aux experts particulièrement crédible, encore que cet indice n'intervienne, en principe, qu'après la classification en A, B, C ou D.

La sur-représentation des agriculteurs et la sous-représentation des employés sont, semble-t-il, la conséquence d'un même phénomène : les observations d'OVNI sont faites à la campagne. Les agriculteurs, personnages de la campagne, sont beaucoup plus "favorisés" que les employés, personnages citadins.

1.4. AGE DU TEMOIN PRINCIPAL

CLASSE AGE DU TEMOIN EFFECTIF
E enfant de 0 à 13 ans 3
J adolescent de 14 à 20 ans 14
A adulte de 21 à 59 ans 73
V vieillard de 60 ans et plus 12
  information non disponible 4

Dans la très grande majorité des cas, le témoin principal est un adulte. Le faible effectif des classes E et J, résulte vraisemblablement de l'une ou l'autre des causes suivantes :

    l'expertise : les enfants sont considérés comme peu crédibles !

    en cas de témoignages multiples, le témoin principal est de préférence un adulte,

    "aller voir les gendarmes" pour raconter son histoire est plus difficile pour un enfant.

REMARQUE :

La nouvelle version des règles de codage permettra d'étudier plus précisément cette variable puisque l'âge figurera, explicitement et non à l'aide d'une classification a priori.

2. LES CORRÉLATIONS AVEC LES PHÉNOMENES OBSERVES :

Comme l'avait suggéré Mme ASKEVIS ( lettre à C. POHER du 12.7.78 ), nous avons étudié les corrélations entre les variables psychosociales et aussi des paramètres décrivant l'observation :

  • le type de phénomène ( établi par les experts ),
  • la forme de "l'objet".

2.1. LE TYPE DE PHENOMENE OBSERVE

Sur l'ensemble des 106 cas analysés, on trouve :

  • 46 cas : "lumière nocturne"
  • 6 cas : "disque diurne"
  • 4 cas : "observation instrumentale"
  • 22 cas : "observation rapprochée type 1" ( < 200 m )
  • 25 cas : "observation rapprochée type 2" ( traces )
  • 3 cas : "observation rapprochée type 3" ( avec débarquement ).

Compte tenu du faible effectif, nous regroupons les trois premières catégories formant ainsi la catégorie C1. La catégorie C2 correspond exclusivement aux observations rapprochées de type 1 et la catégorie C3 regroupe les deux dernières.

 C1   C2   C3 
56 22 28
53 % 21 % 26%

2.1.1. Relation avec la profession du témoin principal

GROUPE SOCIO-PROFESSIONNEL   C1      C2     C3  
0 -1. Agriculteurs exploitants et salariés agricoles 5 (35%) 2 (14%) 7 (50%)
2. Patrons de l'industrie et du commerce 4 (44%) 3 (33%) 2 (22%)
3. Professions libérales et cadres supérieurs 3 (75%) 1 (25%) -
4. Cadres moyens 4 (57%) 3 (43%) -
5. Employés 3 (50%) - 3 (50%)
6. ouvriers 11 (46%) 8 (33%) 5 (21%)
7. Personnels de service 5 (71%) 1 (14%) 1 (14%)
8. Armée-police 6 (55%) 2 (18%) 3 (27%)
9. Personnes non actives 13 (62%) 2 (10%) 6 (29%)

Compte tenu des petits effectifs pour chaque profession, les différences par rapport à une répartition homogène ne sont pas significatives. On peut cependant représenter géométriquement ces résultats pour faire apparaître les points suivants :

  • les agriculteurs exploitants et salariés agricoles (0 + 1) ainsi que les employés se distinguent par une forte proportion de type C3, les premiers l'emportant sur les seconds en ce qui concerne le type C2 ;
  • les professions libérales et les cadres moyens se distinguent an contraire par l'absence de type C3.

REPRESENTATION GÉOMÉTRIQUE DE LA RÉPARTITION
DES TYPES D'OBSERVATION PAR PROFESSION

( La distance à l'axe C2 C3 est proportionnelle à la fréquence de cas de type C1 pour la catégorie représentée ).

2.1.2. Relation avec l'âge du témoin principal

CLASSE AGE OU TÉMOIN PRINCIPAL   C1     C2     C3  
E de 0 à 13 ans - -  3 (100 %) 
J de 14 à 20 ans 10 (71%) 2 (14%) 2 (14%)
A de 21 à 59 ans 36 (49%) 19 (26%) 18 (25%)
V + de 60 ans 7 (58%) 1 (8%) 4 (33%)

Si l'on excepte la classe E, dont l'effectif est très faible, on n'observe aucune variation significative de la répartition des types d'observation entre les différentes classes d'âge. L'âge du témoin principal et le type d'observation apparaissent indépendants.

2.1.3. Relation avec le nombre de témoins

NOMBRE DE TÉMOINS C1 C2 C3
1  8 (38%)   4 (19%)   9 (43%) 
2 12 (13%) 9 (32%) 7 (25%)
3 11 (48%) 6 (26%) 6 (26%)
4 - 5 14 (82%) 1 (6%) 2 (12%)
5 9 (60%) 2 (13%) 4 (27%)

Pour chaque modalité du nombre de témoins, les différences par rapport à la répartition globale ne sont pas significatives. Toutefois, apparaissent les phénomènes suivants :

  • pour les quatre premières classes, la fréquence des rencontres ( types C2 et C3 ) diminue.

    En effet :

    • 1 témoin 62 %
    • 2 témoins 57 %
    • 3 témoins 52%
    • 2-3 témoins 55%
    • 4-5 témoins18 %
    • + de 3 témoins 28%
    • + de 5 témoins 40 %
  • parallèlement à cette évolution, on observe également une décroissance de la fréquence de la classe C3 :
    • 1 témoin 42 %
    • 2-3 témoins 25,5 %
    • + de 3 témoins 19 %

REPRÉSENTATION GÉOMÉTRIQUE DE LA RÉPARTITION
DES TYPES D'OBSERVATION SUIVANT LE NOMBRE DE TÉMOINS

Autrement dit, "l'étrangeté" des observations diminue avec le nombre de témoins. Trois types d'explication peuvent être proposes :

  • lors de l'observation d'un phénomène physique, le nombre de témoins est proportionnel à la distance d'où on peut voir le phénomène. Les rencontres rapprochées ont donc naturellement un nombre moindre de témoins ;
  • la multiplicité des témoins est un facteur limitant l'écart entre la réalité observée et le récit de l'observation ;
  • durant la sélection des cas, les experts ont retenu des cas avec un nombre restreint de témoins préférentiellement lorsque ceux-ci étaient "étranges".

2.2. LA FORME DE L'OBJET OBSERVE

L'étude de ce paramètre est plus délicat du fait de la grande variété de ses modalités, amplifiant ainsi les difficultés dues à la petitesse de l'échantillon. Par ailleurs, le codeur affecte une observation dans une classe de forme en fonction de son interprétation, ce qui impose une grande prudence pour l'utilisation de ces données.

Les résultats figurent ci-après, ne peuvent que suggérer des hypothèses. La répartition des forces est la suivante :

A - disque, soucoupe lenticulaire 10
B - ronde, circulaire, boule 32
C - cigare, cylindre, fusée 14
D - veuf, ovale, ovoïde, ballon de rugby 13
E - conique, triangulaire, trapézoïdal chapeau asiatique 8
H - soucoupe à coupole, chapeau canotier 7
K - ponctuelle, étoile, grosse planète 1
L - dôme, tasse, parachute, parapluie, seule de foin 2
N - méduse, champignon 1
P - croissant 2
Q - cigare accompagné de disques 1
* - information non disponible 7
. - non codable 8
TOTAL :  106

2.2.1. Relation avec la profession du témoin principal

Nous nous limiterons aux formes les plus représentées. Se reporter au tableau de la page suivante.

Afin de faire apparaître quelques faits de structures, nous avons procédé, malgré la faiblesse de l'effectif, à une analyse factorielle des correspondances sur ce tableau.
( voir plus loin également ).

CLASSE GROUPE SOCIO-PROFESSIONNEL   A     B     C     D     E     H  
0 - 1 Agriculteurs exploitants et salariés agricoles 2 3 2 2 1 -
2 Patrons de l'industrie et du commerce - 3 - 2 1 2
3 Professions libérales et cadres supérieurs 1 1 - - - 1
4 Cadres moyens 1 3 2 - - -
5 Employés - 4 1 - 1 -
6 Ouvriers 1 9 4 - 3 3
7 Personnel de service - 2 1 3 - 1
8 Armée - police - 4 2 - - -
9 Personnes non actives 4 3 1 6 2 -

Analyse factorielle des correspondances du tableau ci-dessus.
Représentation dans le plan des deux premiers facteurs :

On distingue un regroupement, en 3 catégories, des groupes socio-professionnels :

  1. "agriculteurs exploitants et salariés agricoles" avec "armée-police" et "personnes non actives". Ce groupe est fortement associé à la forme A et proche des formes D et E ;
  2. "cadres moyens" avec "employés" et "ouvriers". Ce groupe est associé aux gammes C et B et proche de E ;
  3. "patrons de l'industrie et du commerce" avec "professions libérales et cadres supérieurs" et "personnel de service". Ce groupe est proche de E, D et H ( c'est le groupe le plus proche de H ).

Remarquons que ce regroupement des groupes socio-professionnels n'est pas sans logique.
Cependant, les liaisons avec le paramètre forme sont peu interprétables.

2.2.2. Relation avec l'âge du témoin principal

CLASSE AGE DU TÉMOIN PRINCIPAL   A     B     C     D     E     H  
E 13 ans 1 0 0 1 1 0
J de 14 à 20 ans 0 6 1 3 1 1
A de 21 à 59 ans 5 24 10 9 6 5
V 60 ans 2 2 3 0 0 1

Pas de fait significatif.

2.2.3. Relation avec le nombre de témoins

FORMES Nombre de témoins
  1     2     3   4 - 5  + 5 
A 1 3 3 1 2
B 3 10 9 5 4
C 7 2 2 1 2
D 1 2 4 3 3
E 1 1 3 1 2
H 3 3 - - 1
K - - - 1 -
L - 1 - 1 -
N 1 - - - -
P - 1 - 1 -
Q - - - 1 -
* 1 2 1 1 1
. 3 3 1 1 0

Une analyse factorielle des correspondances, limitée aux seules formes A, B, C, D, E et H, conduit à extraire un premier facteur représentant 75 % de l'inertie totale du nuage. Une interprétation de ce facteur apparaît clairement : les quatre premières modalités se retrouvent ordonnées naturellement sur ces axes(*). Si l'on ne tient pas compte de la modalité "plus de 5 témoins", on peut dire que ce facteur représente le nombre de témoins.

(*) Ce phénomène est d'autant plus remarquable que l'analyse factorielle ne tient pas copte des relations d'ordre.

L'analyse factorielle est représentée ci après :

75 % d'inertie

La part d'inertie expliquée (75 %) permet de conclure à une liaison entre le nombre de témoins et la forme de l'objet principal décrit.

Soumettons une hypothèse pour l'interprétation de cette liaison. Pour cela, nous distinguerons trois catégories de formes :

  • formes que nous nommerons "interprétatives" : ce sont les formes suggérant un véhicule soit directement ( fusée ), soit indirectement ( soucoupe à coupole = forme de véhicule extra terrestre popularisé par la science-fiction ) ;
  • formes que nous nommerons formes "anti-interprétatives" qui comme les précédentes, ne donnent une description que par l'intermédiaire de la référence à un objet sais sans que cet objet ne donne une interprétation de l'observation : ballon de rugby, neuf , meule de foin, etc…) ;
  • enfin, formes géométriques : ronde, conique, trapézoïdale.

Bien que les classes de formes utilisées dans le codage ne soient pas homogènes vis à vie de ces catégories ( ex. : la classe H comporte 1 élément des "formes interprétatives" : soucoupe à coupole, et 1 élément de "formes anti-interprétatives" : chapeau de canotier ), nous proposons la classification suivante :

  • formes interprétatives : C, H
  • forces anti-interprétatives : D
  • forces géométriques : A, B et E.

Notre hypothèse concernant la liaison : nombre de témoins/forme de l'objet décrit, peut s'exprimer alors :

  • "Lorsque le nombre de témoins est restreint, les témoins utilisent plus volontiers des formes interprétatives pour la description de leur observation".

Il importe de remarquer qu'il s'agit là uniquement dune hypothèse suggérée par les données. Pour la confirmer, ou l'infirmer, il est nécessaire :

  • de réexaminer la description fournie dans cheque rapport de gendarmerie afin de surmonter les difficultés dues au codage actuel,
  • d' examiner le niveau d'indépendance des témoins .

3. CONCLUSION

L'analyse statistique dont nous venons de présenter les résultats a permis de mettre en lumière quelques faits.

Le plus remarquable est, à notre avis, la liaison entre le nombre de témoins et la forme de l'objet.
Ce nombre de témoins est également lié au type de phénomène .

Il faut cependant rappeler que l'échantillon sur lequel porte cette analyse est très restreint. L'extension prochaine du fichier permettra de confirmer ou d'infirmer certaine résultats. Il nous semble toutefois que l'analyse effectuée permet de poser quelques hypothèses permettant de développer l'étude.




SUITE...




© CNES