Tests d'intégration par. Tests non traditionnels

Le troisième article parlait de tests traditionnels. Des définitions de tests homogènes et hétérogènes y étaient également données. L'article d'aujourd'hui contient des informations sur les tests non traditionnels, qui comprennent des tests intégratifs, adaptatifs, en plusieurs étapes et des tests dits avec interprétation des résultats axée sur des critères.

1. Tests intégratifs
Un test intégratif peut être appelé un test composé d'un système de tâches qui répondent aux exigences de contenu intégratif, d'un formulaire de test et d'une difficulté croissante des tâches visant à un diagnostic final généralisé de l'état de préparation du diplômé. établissement d'enseignement. Le diagnostic est réalisé en présentant de telles tâches, dont les réponses correctes nécessitent une connaissance intégrée (généralisée, clairement interdépendante) de deux et plus disciplines académiques. La création de tels tests est réservée aux enseignants qui connaissent un certain nombre de disciplines académiques et comprennent rôle important les connexions interdisciplinaires dans l'apprentissage sont capables de créer des tâches dont les réponses correctes nécessitent que les étudiants aient des connaissances dans diverses disciplines et la capacité d'appliquer ces connaissances.

Les tests intégratifs sont précédés de l'organisation d'une formation intégrative. Malheureusement, la forme actuelle de direction des cours, combinée à une fragmentation excessive des disciplines académiques, ainsi qu'à la tradition d'enseignement disciplines individuelles(et non des cours généralisés) entraveront pendant longtemps la mise en œuvre d'une approche intégrative dans les processus de formation et de suivi de la préparation. L'avantage des tests intégratifs par rapport aux tests hétérogènes est que chaque tâche est plus informative et moins les tâches elles-mêmes. La nécessité de créer des tests intégratifs augmente à mesure que le niveau d'éducation et le nombre de disciplines académiques étudiées augmentent. Par conséquent, les tentatives visant à créer de tels tests sont notées principalement dans école supérieure. Les tests intégratifs sont particulièrement utiles pour accroître l'objectivité et l'efficacité du résultat final. certificat d'étatélèves et étudiants.

La méthodologie de création de tests intégratifs est similaire à la méthodologie de création de tests traditionnels, à l'exception du travail de détermination du contenu des tâches. Pour sélectionner le contenu des tests intégratifs, utilisez méthodes expertes est obligatoire. Cela est dû au fait que seuls des experts peuvent déterminer l'adéquation du contenu des tâches aux fins du test. Mais avant tout, il sera important que les experts eux-mêmes décident des objectifs de l'éducation et de l'étude de certains programmes éducatifs, puis s'accordent entre eux sur des questions fondamentales, ne laissant pour examen que les variations dans la compréhension du degré d'importance éléments individuels V structure générale préparation. Une composition convenue, sur des questions fondamentales et sélectionnées, d'experts en littérature étrangère souvent un panneau. Ou étant donné les différences de sens dernier mot, en russe, une telle composition peut être appelée un groupe d'experts représentatif. Le groupe est sélectionné pour représenter adéquatement l’approche utilisée pour créer le test en question.

2. Tests adaptatifs
La faisabilité du contrôle adaptatif découle de la nécessité de rationaliser les tests traditionnels. Chaque enseignant comprend qu'un élève bien préparé n'a pas besoin de lui confier des tâches faciles ou très faciles. Parce que la probabilité de prendre la bonne décision est trop élevée. De plus, les matériaux légers n'ont pas de potentiel de développement notable. Symétriquement, en raison de la forte probabilité mauvaise décision Cela ne sert à rien de confier des tâches difficiles à un élève faible. On sait que les tâches difficiles et très difficiles réduisent motivation à apprendre de nombreux étudiants. Il fallait trouver une mesure comparable, sur une même échelle, de la difficulté des tâches et une mesure du niveau de connaissance. Cette mesure a été trouvée en théorie dimensions pédagogiques. Le mathématicien danois G. Rasch a appelé cette mesure le mot « logit » (1). Après l’avènement des ordinateurs, cette mesure a constitué la base de la méthodologie adaptative de contrôle des connaissances, qui utilise des méthodes pour réguler la difficulté et le nombre de tâches présentées, en fonction de la réponse des étudiants. Si la réponse est positive, l'ordinateur sélectionne la tâche suivante, plus difficile ; si la réponse est infructueuse, la tâche suivante sera plus facile. Naturellement, cet algorithme nécessite des tests préalables de toutes les tâches, déterminant leur degré de difficulté, ainsi que la création d'une banque de tâches et d'un programme spécial.

L'utilisation de tâches qui correspondent au niveau de préparation augmente considérablement la précision des mesures et minimise la durée des tests individuels à environ 5 à 10 minutes. Les tests adaptatifs permettent d'émettre des tâches par ordinateur au niveau optimal d'environ 50 %. probabilité de la bonne réponse pour chaque élève.

DANS Littérature occidentale Il existe trois options pour les tests adaptatifs. Le premier est appelé test pyramidal. En l'absence d'évaluations préliminaires, toutes les matières se voient confier une tâche de difficulté moyenne et ensuite seulement, en fonction de la réponse, chaque matière se voit confier une tâche plus facile ou plus difficile ; A chaque étape, il est utile d'utiliser la règle consistant à diviser l'échelle de difficulté en deux. Dans la deuxième option, le contrôle commence par n'importe quel niveau de difficulté souhaité par le sujet testé, avec une approche progressive du niveau réel de connaissances. La troisième option est lorsque les tests sont effectués à travers une banque de tâches divisées par niveaux de difficulté.

Ainsi, le test adaptatif est une variante système automatisé tests, dans lesquels les paramètres de difficulté et la capacité de différenciation de chaque tâche sont connus à l'avance. Ce système est créé sous la forme d'une banque informatique de tâches, ordonnées en fonction des caractéristiques des tâches d'intérêt. Le plus caractéristique principale les tâches de test adaptatif sont leur niveau de difficulté, obtenu empiriquement, ce qui signifie : avant d'arriver à la banque, chaque tâche est soumise à des tests empiriques pendant une durée suffisante grand nombreétudiants typiques de la population d’intérêt. Les mots « contingent d’intérêt » visent à représenter ici le sens du concept plus rigoureux de « population générale » connu en science.

Les origines de l’approche adaptative remontent à l’émergence de ouvrages pédagogiques Comenius, Pestalozzi et Disterweg, qui sont unis par les idées de conformité à la nature et d'humanité du savoir. Au centre d'eux systèmes pédagogiquesétait étudiant. Par exemple, dans l'ouvrage peu connu de A. Disterweg (2) « Règles didactiques » (Kiev, 1870), on peut lire les mots suivants : « Enseigner conformément à la nature... Enseigner sans lacunes... Commencer à enseigner là où le l’élève s’est arrêté… Avant de commencer à enseigner, il faut explorer le point de départ… Sans savoir où l’élève s’est arrêté, il est impossible de lui enseigner décemment. Le manque de conscience du niveau réel de connaissances des étudiants et les différences naturelles dans leur capacité à assimiler les connaissances proposées sont devenues raison principale apparence systèmes adaptatifs, basé sur le principe d’individualisation des apprentissages. Ce principe est difficile à mettre en œuvre sous la forme d’un cours traditionnel en classe.

Avant l'avènement des premiers ordinateurs, la plupart système connu, proche de l’apprentissage adaptatif, était ce qu’on appelle le « Système assimilation complète connaissance." Cela a déjà été écrit dans l'école n° 26/99.

3. Les tests dits « basés sur des critères »
Il s'agit d'un nom très conventionnel et, en principe, incorrect pour un groupe de tests qui ont reçu une certaine diffusion et reconnaissance dans notre pays. Malheureusement, une tentative a même été faite pour introduire cette appellation dans le texte de nos lois sur la certification et les normes, ce à quoi l'auteur de cet article s'est opposé (3). Il ne s’agit essentiellement pas de tests, mais d’une interprétation unique des résultats des tests.

Si tâche principale est le désir de savoir - quels éléments du contenu de la discipline académique ont été maîtrisés par l'un ou l'autre sujet de test, alors il s'agit d'un cas de fond - approche pédagogiqueà l'interprétation des résultats des tests. Dans ce cas, il est déterminé lequel des population tâches (en anglais Domain) que le sujet connaît et ce qu'il ne sait pas. L'interprétation des résultats est effectuée par les enseignants, dans la langue de la discipline académique.

La conclusion se construit selon une chaîne logique : le contenu de la discipline académique ® (c'est une flèche, voici à quoi cela ressemble ici) la population générale des tâches de mesure des connaissances ® test, comme échantillon de tâches de cette population , les réponses du sujet de test ® une conclusion probabiliste sur sa connaissance de la discipline académique. Lorsqu’on cible de tels tests, un grand nombre de tâches sont requises et suffisantes définition complète contenu de la discipline étudiée. L'interprétation des résultats est effectuée par les enseignants des matières.

Le débat s’articule autour de deux questions principales :

1) l'exactitude du contenu du test, c'est-à-dire l'exactitude de la formulation de ses tâches, la validité scientifique disciplinaire et l'admissibilité du test pour tester les connaissances d'intérêt dans un groupe de matières donné. Lorsqu'ils plaident en faveur d'un test particulier, les enseignants d'une matière s'appuient sur appareil conceptuel, les principes linguistiques et, en général, la connaissance de la discipline académique qu'ils enseignent. Dans de tels cas, on parle de tests avec une interprétation des résultats orientée vers le contenu (4). C'est ce qu'on appelle les tests référencés par domaine, qui peuvent être traduits par la corrélation des connaissances issues des résultats de tests avec les connaissances. liste complète qui sont représentés dans la population générale (domaine).

2) la validité de l'évaluation des connaissances tout au long matière académique, sur la base des résultats des sujets testés sur un petit échantillon d'éléments de test ; un échantillon d'une population potentiellement ou réellement existante de toutes les tâches qui pourraient être confiées aux sujets pour une évaluation sûre et raisonnable. En fait, il s'agit de justifier l'exactitude de l'inférence inductive sur la connaissance d'un grand nombre de questions basée sur les réponses à un petit nombre d'items de test.

Le deuxième type de tests est associé à une focalisation sur de tels objectifs spécifiques et des tâches, telles que la vérification du niveau de maîtrise d'une liste relativement courte de connaissances, compétences et aptitudes requises, servant de norme ou de critère de maîtrise donné. Par exemple, pour la certification des diplômés des établissements d'enseignement, il est important d'avoir des tâches permettant de tirer une conclusion sur la compétence minimale acceptable des diplômés. À l’étranger, ils sont appelés : Tests de compétences minimales. Lors de la vérification du niveau minimum acceptable de connaissances, le contenu des tâches est fondamentalement simplifié. Étant donné que de telles tâches doivent être accomplies par tous les diplômés admis par l'établissement d'enseignement pour la certification, il est impossible de parler de tests comme d'une méthode de mesure objective et efficace des matières avec différents niveaux préparation, au sens strict de la notion de « test ». Cette approche a été développée pour les autorités éducatives confrontées au besoin de peu de temps vérifier l'état de l'éducation dans grandes quantités établissements d'enseignement, et ne pas permettre à ces derniers de tomber en dessous du niveau d'exigence maximal admissible.

Dans de tels cas, la littérature occidentale parle de tests avec une interprétation des résultats axée sur des critères. La conclusion se construit selon une chaîne logique : tâches - réponses - conclusions sur la conformité du sujet à un critère donné. Par interprétation critériée, nous entendons une comparaison du contenu des documents de certification avec les résultats des tests et une conclusion : qu'est-ce qui a été réellement appris dans une norme donnée, en termes d'exigences, et à quel niveau.

Avec une interprétation critériée, un nombre légèrement inférieur de tâches sont nécessaires, grâce auxquelles il est déterminé ce que le sujet sait et ce qu'il ne sait pas à partir d'une norme donnée. En d'autres termes, ici, les réponses ne sont pas évaluées par rapport à l'ensemble du domaine (domaine) des connaissances requises, mais uniquement à partir du domaine limité par une norme ou un niveau (critère) de connaissances spécifique. Comme c'est le cas pour les tests référencés par domaine, l'interprétation des résultats est effectuée dans la langue de la discipline académique, mais principalement par les employés des autorités éducatives et les enseignants sur lesquels les gestionnaires s'appuient lors de la certification.

De l’avis de l’auteur, les « tests » utilisés dans ce cas ne répondent pas aux véritables exigences des tests traditionnels et adaptatifs. Avec une interprétation critériée, pour diagnostiquer un niveau de préparation prédéterminé, on n'utilise essentiellement pas de tests, au sens traditionnel de cette méthode, mais des ensembles de tâches sous forme de test et autres, rien de plus. Le mot est un, mais le sens est différent. Les « tests » avec une interprétation critériée sont souvent opposés aux tests avec une interprétation des résultats dite normative. En fait, ces derniers sont des tests traditionnels, dont certains comportent des variantes parallèles.

Littérature
  1. Rasch, G. Modèles probabilistes pour certains tests d'intelligence et de réussite. Avec un avant-propos et une postface de B.D. Wright. L'Univ. de Chicago Press. Chicago et Londres, 1980. 199 p. Pour une perception plus précise du sens du concept « logit », certains formalismes peuvent être utiles. Essentiellement, G. Rush a introduit deux mesures : le « logit du niveau de connaissance » et le « logit du niveau de difficulté de la tâche ». Il a défini le premier comme logarithme népérien le rapport entre la proportion de réponses correctes d'un sujet à tous les éléments du test et la proportion de réponses incorrectes, et le second - en tant que logarithme népérien d'un autre rapport - la proportion de réponses incorrectes à un élément du test par rapport à la proportion de réponses correctes à la même tâche, pour un ensemble de sujets.
  2. Disterweg A. « Règles didactiques » (Kiev, 1870)
  3. Voir, par exemple, l'article : Avanesov V.S. " Normes éducatives il faut changer." USh, n° 46, décembre 1998
  4. Animé W. (éd.). Tests référencés par domaine. Publications de technologie éducative. Falaises d'Englewood, New Jersey, 1974.
  5. Berk R.A. (Éd.). Un guide sur les critères - Construction de tests référencés. L'Université John Hopkins. Presse, Baltimore, 1984.

Classes et types de tests.

Il existe deux grandes classes de tests : traditionnel Et non traditionnel.

Le test a composition, intégrité Et structure. Il se compose de :

  • missions;
  • les règles de leur application ;
  • notes pour avoir accompli chaque tâche ;
  • recommandations pour l’interprétation des résultats des tests.

Intégrité des tests désigne la relation des tâches, leur appartenance à un facteur commun mesuré. Chaque tâche de test remplit le rôle qui lui est assigné et aucune d'entre elles ne peut donc être supprimée du test sans perte de qualité de mesure.

Structure des tests constitue un moyen de relier les tâches les unes aux autres. Fondamentalement, c'est ce qu'on appelle structure factorielle, dans lequel chaque tâche est connectée aux autres via contenu général et la variation globale des résultats du test.

Un test traditionnel est une unité d'au moins trois systèmes :

  • un système de connaissances significatif décrit dans la langue de la discipline académique testée ;
  • un système formel de tâches de difficulté croissante ;
  • caractéristiques statistiques tâches et résultats des tests.

Le test pédagogique traditionnel doit être envisagé de deux manières significatives : comme méthode de mesure pédagogique et à la suite de l'application de tests.

ceux st est un système de tâches qui forment la meilleure intégrité méthodologique. L'intégrité du test est l'interaction stable des tâches qui forment le test en tant que système en développement.

Tests homogènes

Les tests traditionnels incluent des tests homogène Et hétérogène.

Test homogène représente un système de tâches de difficulté croissante, de forme spécifique et de contenu spécifique - un système créé dans un but objectif, qualitatif et méthode efficaceévaluer la structure et mesurer le niveau de préparation des étudiants dans une discipline académique.

Les tests homogènes sont plus courants que les autres. En pédagogie, ils sont créés pour contrôler les connaissances dans une discipline académique ou dans une section d'une discipline académique volumineuse comme la physique, par exemple. Dans un test pédagogique homogène, l'utilisation de tâches révélant d'autres propriétés n'est pas autorisée. La présence de ce dernier viole l'exigence de pureté disciplinaire de l'épreuve pédagogique. Après tout, chaque test mesure quelque chose de prédéterminé.



Tests hétérogènes

Test hétérogène représente un système de tâches de difficulté croissante, de forme spécifique et de contenu spécifique - un système créé dans le but d'une méthode objective, de haute qualité et efficace pour évaluer la structure et mesurer le niveau de préparation des étudiants dans plusieurs disciplines académiques.

Souvent, ces tests incluent également tâches psychologiques pour évaluer le niveau de développement intellectuel.

Des tests généralement hétérogènes sont utilisés pour évaluation complète diplômés de l'école, évaluation de la personnalité lors de la candidature à un emploi et pour la sélection des candidats les plus préparés à l'admission dans les universités. Chaque test hétérogène étant constitué de tests homogènes, l'interprétation des résultats des tests s'effectue en fonction des réponses aux tâches de chaque test (on les appelle ici échelles) et, en plus, à travers diverses méthodes des tentatives d'agrégation de scores sont faites pour donner évaluation globale préparation du sujet de test.

L'interprétation des résultats des tests s'effectue principalement dans le langage de la testologie, sur la base de la moyenne arithmétique, du mode ou de la médiane et des normes dites centiles, indiquant quel pourcentage des candidats ont résultat du test pire que n'importe quel sujet analysé avec ses résultats au test. Cette interprétation est appelée orienté normatif.

Tests intégratifs

Intégratif peut être appelé un test composé de systèmes de tâches qui répondent aux exigences de contenu intégratif, formulaire de test, difficulté croissante des tâches visant à un diagnostic final généralisé de l'état de préparation d'un diplômé d'un établissement d'enseignement.

Le diagnostic est réalisé en présentant de telles tâches, dont les réponses correctes nécessitent des connaissances intégrées (généralisées, clairement interdépendantes) dans le domaine de deux ou plusieurs disciplines académiques. La création de tels tests est réservée aux enseignants qui connaissent un certain nombre de disciplines académiques, comprennent le rôle important des liens interdisciplinaires dans l'apprentissage et sont capables de créer des tâches dont les réponses correctes nécessitent que les étudiants aient une connaissance de divers disciplines et la capacité d’appliquer ces connaissances.

Les tests intégratifs sont précédés par l'organisation apprentissage intégratif. Malheureusement, la forme actuelle de conduite des cours en classe, combinée à une fragmentation excessive des disciplines académiques, ainsi qu'à la tradition d'enseignement de disciplines individuelles (plutôt que de cours généralisés), entravera pendant longtemps la mise en œuvre d'une approche intégrative dans les processus. d’apprentissage et de suivi de la préparation.

L'avantage des tests intégratifs par rapport aux tests hétérogènes réside dans le contenu informatif plus important de chaque tâche et dans le plus petit nombre de tâches elles-mêmes.

Tests adaptatifs

La faisabilité du contrôle adaptatif découle de la nécessité de rationaliser les tests traditionnels.

Chaque enseignant comprend qu'il n'est pas nécessaire de confier à un élève bien préparé des tâches faciles ou très faciles, car la probabilité d'une solution correcte est trop élevée. De plus, les matériaux légers n'ont pas de potentiel de développement notable. Symétriquement, en raison de la forte probabilité d'une mauvaise décision, il ne sert à rien de confier des tâches difficiles à un élève faible. Il est connu que les tâches difficiles et très difficiles réduisent la motivation d’apprentissage de nombreux étudiants.

La caractéristique la plus importante des tâches de tests adaptatifs est leur niveau de difficulté, obtenu empiriquement, ce qui signifie : avant d'arriver à la banque, chaque tâche est soumise à des tests empiriques sur un nombre suffisamment grand d'étudiants types de la population d'intérêt. Les mots « contingent d’intérêt » visent à représenter ici le sens du concept plus rigoureux connu en science de « population générale ».

Les tests présentent les avantages suivants par rapport aux autres méthodes contrôle pédagogique:

· augmenter la rapidité de contrôle de la qualité des connaissances et des compétences acquises par les étudiants ;

· mise en œuvre d'une couverture bien superficielle mais complète de tout matériel pédagogique;

· réduction des impacts influence négative sur les résultats des tests de facteurs tels que l'humeur, le niveau de qualification et d'autres caractéristiques d'un enseignant particulier, c'est-à-dire minimisation facteur subjectif lors de l'évaluation des réponses ;

· une grande objectivité et, par conséquent, un plus grand effet stimulant positif sur activité cognitiveétudiant;

· se concentrer sur le moderne moyens techniques, pour utilisation dans l'environnement de systèmes de formation et de surveillance informatiques ;

· la possibilité d'un traitement mathématique et statistique des résultats du contrôle, et par conséquent, d'augmenter l'objectivité du contrôle pédagogique ;

· mise en œuvre du principe d'individualisation et de différenciation des formations grâce à l'utilisation de tests adaptatifs ;

· la capacité d'augmenter la fréquence et la régularité des contrôles en réduisant le temps nécessaire à l'exécution des tâches et en automatisant l'inspection ;

· faciliter le processus d’intégration du système éducatif du pays dans le système européen.

Les tests peuvent être classés sur la base suivante :

1. Domaine application des tests: mono-sujet, multi-sujet, intégratif.
Intégratif peut être appelé un test composé de telles tâches, dont les réponses correctes nécessitent une connaissance intégrée (interdépendante, généralisée) de deux ou plusieurs disciplines académiques. L'utilisation de tels tests à l'école, tant de contrôle que pédagogiques, est un excellent moyen de mettre en œuvre des liens interdisciplinaires dans l'enseignement.

2. Orientation générale de la conception du test: orienté normatif ou orienté critère (orienté sujet).
À orienté normatif approche, des tests sont développés pour comparer les matières par niveau résultats scolaires.
Principal poinçonner spécifique à un sujet le test est l'interprétation de la performance d'un test du point de vue de son contenu sémantique. L'accent est mis sur un domaine de contenu strictement défini (ce que les candidats peuvent et savent), et non sur leur apparence par rapport aux autres.

3.Didactique-psychologique orientation du test : test de réussite pour contrôler la connaissance de la théorie ; un test de réussite pour contrôler les capacités et compétences plus ou moins complexes dans une matière donnée, un test de capacité d'apprentissage (diagnostic des capacités éducatives réelles dans ce cercle matière ou connaissances cycliques - mathématiques, linguistiques, etc.).

4.Orientation vers une étape spécifique du contrôle: essais de contrôle préliminaire, tests contrôle actuel, tests de contrôle final.

5. Activité dominante du sujet lors de la réalisation des tests– oral, écrit, informatique.

6. Nombre d'objets de contrôle: tests qui ont un objet de contrôle (par exemple, le nombre d'opérations effectuées au bon niveau) ou plusieurs (qualité, quantité, rapidité, séquence stricte, connaissance des mêmes opérations).

7. Degré d'homogénéité tâches de test : tests avec des formes homogènes ou hétérogènes de tâches de construction.

8. Facteur de vitesse: rapide (avec enregistrement obligatoire du temps d'exécution) et non rapide.

9. Formulaire d'organisation de tests: masse, individuel, groupe.

Séparément, il y a ce qu'on appelle adaptatif tests basés sur le principe d’individualisation des apprentissages. Chaque enseignant comprend qu'il ne sert à rien de confier à un bon élève des tâches faciles et très faciles, tout comme il ne sert à rien de confier des tâches difficiles à un élève faible. Dans la théorie des mesures pédagogiques, une mesure de la difficulté de la tâche et une mesure du niveau de connaissance se révèlent comparables sur la même échelle. Après l’avènement des ordinateurs, cette mesure a constitué la base de la méthode de contrôle adaptatif des connaissances, où la difficulté et le nombre de tâches présentées sont régulés en fonction des réponses des élèves.

La conférence est la deuxième d'une série de trois couvrant les niveaux du processus de vérification. Le sujet de cette conférence est le processus de test d'intégration, ses tâches et ses objectifs. Les aspects organisationnels des tests d'intégration sont pris en compte - classifications structurelles et temporelles des méthodes de tests d'intégration, planification des tests d'intégration. Le but de ce cours : donner une idée du processus de test d'intégration, de ses composantes techniques et organisationnelles

Objectifs et buts des tests d'intégration

Le résultat des tests et de la vérification des modules individuels qui composent le système logiciel doit permettre de conclure que ces modules sont cohérents en interne et sont conformes aux exigences. Cependant, les modules individuels fonctionnent rarement seuls, c'est pourquoi la tâche suivante après le test des modules individuels consiste à tester l'interaction correcte de plusieurs modules combinés en un seul tout. Ce type de test est appelé test d'intégration. Son objectif est de garantir l'exactitude collaboration composant du système.

Tests d'intégrationégalement appelé test d'architecture système. D'une part, ce nom est dû au fait que les tests d'intégration incluent des vérifications de tous les types possibles d'interactions entre les modules logiciels et les éléments définis dans l'architecture du système. Ainsi, les tests d'intégration vérifient l'intégralité des interactions dans la mise en œuvre du système. testé. D'autre part, les résultats des tests d'intégration sont l'une des principales sources d'informations pour le processus d'amélioration et de clarification de l'architecture du système, des interfaces intermodules et intercomposants. Autrement dit, de ce point de vue, les tests d'intégration vérifient l'interaction correcte des composants du système.

Un exemple de vérification de l'exactitude de l'interaction peut être deux modules, dont l'un accumule les messages de protocole sur les messages reçus.

Sinitsyn S.V., Nalyutin N.Yu. Vérification du logiciel

fichiers, et le second affiche ce protocole à l'écran. Les exigences fonctionnelles du système stipulent que les messages doivent être affichés à l'envers ordre chronologique. Cependant, le module de stockage des messages les stocke dans un ordre direct et le module de sortie utilise la pile pour les envoyer vers ordre inverse. Les tests unitaires qui touchent chaque module individuellement n'auront aucun effet ici - la situation inverse est tout à fait possible, dans laquelle les messages sont stockés dans l'ordre inverse et sortis à l'aide d'une file d'attente. Un problème potentiel ne peut être détecté qu'en vérifiant l'interaction des modules à l'aide de tests d'intégration. Le point clé voici que le système dans son ensemble génère des messages dans l'ordre chronologique inverse, c'est-à-dire qu'en vérifiant le module de sortie et en constatant qu'il émet des messages dans l'ordre direct, nous ne pouvons pas garantir que nous avons détecté un défaut.

Grâce aux tests d'intégration et à l'élimination de tous les défauts identifiés, une architecture cohérente et holistique du système logiciel est obtenue, c'est-à-dire Nous pouvons considérer les tests d’intégration comme une architecture de test et des exigences fonctionnelles de bas niveau.

Les tests d'intégration sont généralement un processus itératif qui teste la fonctionnalité d'un ensemble de modules de plus en plus large.

Les tests d'intégration consistent à tester une partie d'un système composé de deux modules ou plus. La tâche principale des tests d'intégration est de rechercher des défauts associés à des erreurs dans la mise en œuvre et l'interprétation de l'interaction d'interface entre les modules.

D'un point de vue technologique, les tests d'intégration sont un développement quantitatif des tests unitaires, puisque, tout comme les tests unitaires, ils opèrent sur les interfaces des modules et sous-systèmes et nécessitent la création d'un environnement de test, comprenant des stubs à la place des modules manquants. La principale différence entre les tests unitaires et d'intégration réside dans les objectifs, c'est-à-dire les types de défauts détectés, qui à leur tour déterminent la stratégie de sélection des données d'entrée et des méthodes d'analyse. En particulier, au niveau des tests d'intégration, des méthodes associées à la couverture des interfaces sont souvent utilisées, par exemple l'appel de fonctions ou de méthodes, ou l'analyse de l'utilisation d'objets d'interface tels que des ressources globales, des moyens de communication fournis par le système d'exploitation.

Sur la fig. La figure 15 montre la structure du complexe de programmes K, composé des modules M1, M2, M11, M12, M21, M22 testés au stade des tests unitaires. Le problème résolu par la méthode de test d'intégration est le test des connexions intermodulaires mises en œuvre lors de l'exécution du logiciel du complexe K.

Riz. 15. Exemple de structure d'un progiciel

Les tests d'intégration utilisent un modèle de boîte blanche au niveau de l'unité. Le testeur connaissant en détail le texte du programme avant d'appeler tous les modules inclus dans le complexe testé, l'utilisation de critères structurels à ce stade est possible et justifiée.

Les tests d'intégration sont utilisés au stade de l'assemblage de modules testés unitairement en un seul complexe. Il existe deux méthodes connues pour assembler des modules :

Monolithique, caractérisé par l'intégration simultanée de tous les modules dans un complexe testé ;

Incrémental, caractérisé par une construction étape par étape (module par module) d'un ensemble de programmes avec des tests étape par étape du complexe assemblé.

Dans la méthode incrémentale, il existe deux stratégies pour ajouter des modules :

1) « De haut en bas » et les tests ascendants correspondants.

2) Tests « ascendants » et, par conséquent, descendants.

Les caractéristiques du test monolithique sont les suivantes : pour remplacer les modules qui n'étaient pas développés au moment du test, à l'exception de celui du haut (module K sur la Fig. 15), il est nécessaire de développer en plus des pilotes (pilote de test) et/ou des stubs (stubs) qui remplacent les modules manquants au moment de la session de test des niveaux inférieurs.

Une comparaison des approches monolithiques et intégrales donne ce qui suit.

1. Les tests monolithiques nécessitent beaucoup de travail associé au développement supplémentaire de pilotes et de stubs et à la difficulté d'identifier les erreurs qui apparaissent dans l'espace du code assemblé.

2. Les tests étape par étape sont associés à moins de difficulté à identifier les erreurs en raison d'une augmentation progressive du volume du code testé et, par conséquent, à localiser la zone ajoutée du code testé.

Les caractéristiques des tests descendants sont les suivantes : organisation d'un environnement pour la file d'attente exécutable des appels par modules testés des modules testés, développement et utilisation constants de stubs, organisation de tests prioritaires des modules contenant des opérations d'échange avec l'environnement, ou des modules critique pour l’algorithme testé.

Par exemple, l'ordre de test du complexe K (Fig. 15) dans les tests descendants pourrait être celui indiqué ci-dessous, où le scénario de test développé pour le module Mi est noté XYi = (X, Y)i.

K->XYk
M1->XY1
M11->XY11
M2->XY2
M22->XY22
M21->XY21
M12->XY12

Les inconvénients des tests descendants incluent :

Le problème de développer des stubs suffisamment « intelligents », c’est-à-dire des talons capables d'être utilisés pour simuler divers modes de fonctionnement du complexe requis pour les tests ;

La complexité d'organiser et de développer un environnement pour mettre en œuvre l'exécution des modules dans l'ordre requis ;

La mise en œuvre des modules n'est pas toujours efficace en raison de l'ajustement (spécialisation) de modules de niveau inférieur non encore testés sur des modules déjà testés. niveaux supérieurs avec développement parallèle de modules de niveaux supérieur et inférieur.

Les caractéristiques des tests ascendants sont l'organisation de l'ordre d'assemblage et le passage aux modules de test correspondant à l'ordre de leur mise en œuvre.

Par exemple, l'ordre de test du complexe K (Fig. 15) lors des tests descendants pourrait être le suivant :

M11->XY11
M12->XY12
M1->XY1
M21->XY21
M2 (M21, tronçon (M22)) -> XY2
K(M1, M2(M21, Stub(M22)) ->XYk
M22->XY22
M2->XY2
K->XYk

Les inconvénients des tests ascendants comprennent :

Retard dans la vérification des caractéristiques conceptuelles du complexe testé ;

La nécessité de développer et d'utiliser des pilotes.

100 roubles bonus pour la première commande

Sélectionnez le type de travail Thèse Cours Abstrait Mémoire de maîtrise Rapport de pratique Article Rapport Examen Test Monographie Résolution de problèmes Plan d'affaires Réponses aux questions Travail créatif Essai Dessin Compositions Traduction Présentations Dactylographie Autre Augmenter le caractère unique du texte Mémoire de maîtrise Travaux de laboratoire Aide en ligne

Découvrez le prix

Le troisième article (US n° 32) parlait des tests traditionnels. Des définitions de tests homogènes et hétérogènes y étaient également données. L'article d'aujourd'hui contient des informations sur les tests non traditionnels, qui comprennent des tests intégratifs, adaptatifs, en plusieurs étapes et dits axés sur des critères.

Un test intégratif peut être appelé un test composé d'un système de tâches qui répondent aux exigences de contenu intégratif, d'un formulaire de test et d'une difficulté croissante des tâches visant à un diagnostic final généralisé de l'état de préparation d'un diplômé d'un établissement d'enseignement. Le diagnostic est réalisé en présentant de telles tâches, dont les réponses correctes nécessitent une connaissance intégrée (généralisée, clairement interdépendante) de deux ou plusieurs disciplines académiques. La création de tels tests est réservée aux enseignants qui connaissent un certain nombre de disciplines académiques, comprennent le rôle important des liens interdisciplinaires dans l'apprentissage et sont capables de créer des tâches dont les réponses correctes nécessitent que les étudiants aient une connaissance de divers disciplines et la capacité d’appliquer ces connaissances.

Les tests intégratifs sont précédés de l'organisation d'une formation intégrative. Malheureusement, la forme actuelle de conduite des cours en classe, combinée à une fragmentation excessive des disciplines académiques, ainsi qu'à la tradition d'enseignement de disciplines individuelles (plutôt que de cours généralisés), entravera pendant longtemps la mise en œuvre d'une approche intégrative dans les processus. d’apprentissage et de suivi de la préparation. L'avantage des tests intégratifs par rapport aux tests hétérogènes réside dans le contenu informatif plus important de chaque tâche et dans le plus petit nombre de tâches elles-mêmes. La nécessité de créer des tests intégratifs augmente à mesure que le niveau d'éducation et le nombre de disciplines académiques étudiées augmentent. Par conséquent, les tentatives visant à créer de tels tests sont principalement observées dans l'enseignement supérieur. Les tests intégratifs sont particulièrement utiles pour accroître l'objectivité et l'efficacité de la certification d'État finale des étudiants.

La méthodologie de création de tests intégratifs est similaire à la méthodologie de création de tests traditionnels, à l'exception du travail de détermination du contenu des tâches. Pour sélectionner le contenu des tests intégratifs, le recours à des méthodes expertes est obligatoire. Cela est dû au fait que seuls des experts peuvent déterminer l'adéquation du contenu des tâches aux fins du test. Mais, tout d'abord, il sera important que les experts eux-mêmes décident des objectifs de l'éducation et de l'étude de certains programmes éducatifs, puis se mettent d'accord entre eux sur les questions fondamentales, ne laissant pour examen que des variations dans la compréhension du degré d'importance d'éléments individuels dans la structure globale de la préparation. Une composition sélectionnée d'experts en littérature étrangère, convenus sur des questions fondamentales, constitue souvent un panel. Ou, compte tenu des différences dans la signification du dernier mot de la langue russe, une telle composition peut être qualifiée de groupe d'experts représentatif. Le groupe est sélectionné pour représenter adéquatement l’approche utilisée pour créer le test en question.



Avez-vous aimé l'article? Partagez avec vos amis !