пятница, 15 июня 2012 г.

Выбор и оценка тестов

Охарактеризовать состояние спортсменов можно с помощью тестов или контрольных упражнений. Напомним, что тестом называется задание стандартной формы (словесного характера, в виде рисунков или какого-либо физического упражнения), применяемое с целью определения умственного развития, волевых качеств, двигательных способностей и других сторон личности человека. Успешность тестирования зависит от решения по меньшей мере двух задач:

1. Какие тесты должны быть отобраны для оценки состояния человека?
2. Сколько нужно тестов, чтобы получить минимум информации о состоянии человека?
Решение первой задачи связано с теорией стандартизации тестов. Согласно этой теории, практическому применению тестов должна предшествовать их проверка на валидность, воспроизводимость и объективность.

Валидность — это первый и важнейший критерий стандартизации, предполагающий, что данный тест (или контрольное упражнение) оценивает именно то двигательное качество (или какое-либо иное свойство моторики человека), для оценки которого он создавался.

Обычно валидность устанавливается в два этапа. Первый — на основе теоретических предположений о том, какая из функциональных систем организма является ведущей при выполнении физического упражнения. Например, из физиологии и биохимии известно, что результаты во многих длительных упражнениях зависят в первую очередь от деятельности сердечно-сосудистой и дыхательной системы. Установив это, можно подбирать тесты, которые предположительно могут охарактеризовать эти системы. Такими тестами, возможно, будут показатели максимального потребления кислорода, минутного объема дыхания, систолического объема сердца, работоспособности, оцениваемой на велоэргометре или шаговым степ-тестом ), и т, п.

Второй этап связан с количественной оценкой валидности у отобранных тестов. Эта оценка производится с помощью расчета коэффициента валидности. Он вычисляется так. У определенной группы спортсменов измеряется результат в соревновательном упражнении и результаты в тестах, после чего между ними рассчитывается коэффициент корреляции.

В футболе невозможно единым показателем точно измерить эффективность игры, но приближенно это сделать можно. Для этого целесообразно определять коэффициент эффективности («надежности»— в терминологии Ю. А. Морозова), и сопоставить его с результатами в тестах.

Валидность теста может либо изменяться, либо оставаться постоянной при изменении состоянии футболиста. Если коэффициент валидности остается стабильным при изменении состояния человека, то такую валидность принято называть параллельной. Тесты с такой валидностью замечательны тем, что с их помощью можно оценивать состояние спортсмена в разные периоды тренировочного цикла или же состояния разных по тренированности спортсменов. Чаще, однако, встречаются случаи, когда способность оценивать тестом какое-либо свойство спортсмена зависит от уровня его состояния. Это серьезно осложняет работу по созданию унифицированного комплекса тестов, пригодных для оценки разных состояний одного и того же спортсмена.

Следующий критерий стандартизации тестов — это воспроизводимость (иногда в научной литературе это свойство теста называют надежностью или достоверностью). Согласно требованиям этого критерия, тест обладает высокой вопроизводимостью, если при повторном тестировании одного и того же спортсмена в стандартных условиях удается регистрировать одинаковые (или близкие к ним) результаты. Как и валидность, воспроизводимость может быть оценена количественно с помощью расчета коэффициента воспроизводимости. При этом в первом столбце записываются результаты первой попытки, во втором — второй. В последующих двух столбцах таблицы определяется место, занятое испытуемым в первой попытке (х) и во второй (у). В пятом столбце показана разность между местами, занятыми в первой и второй попытках. В качестве примера приведем определение воспроизводимости в тесте, оценивающем прыгучесть футболистов (прыжок в высоту с места, отталкиваясь двумя ногами). Ход расчета представлен в таблице расчета коэффициента воспроизводимости.


где r—коэффициент воспроизводимости,
n — число испытуемых, г — сумма, d—разность попыток у каждого испытуемого.

Полученный коэффициент, равный 0,77, указывает на сравнительно высокую воспроизводимость этого теста. Если в таких расчетах коэффициент оказывается равным 0,9 и выше, то воспроизводимость теста считается очень высокой, при 0,6 и ниже —очень низкой. Воспроизводимость теста может быть искусственно повышена за счет увеличения числа попыток. Если при двукратном тестировании (подряд) какого-либо скоростного качества (например, времени реакции) коэффициент воспроизводимости обычно колеблется в пределах 0,2—0,4 (очень низкая величина), то увеличение числа попыток до 9—15 приводит к увеличению значения коэффициента, а значит, и воспроизводимости до 0,7—0,9. К сожалению, при обследовании спортсменов такой путь не всегда применим, так как он приводит к резкому увеличению затрат времени, средств и искажению данных вследствие утомления тестируемых.

Любой тест должен проверяться и на объективность, которая предполагает однозначность результатов по данному тесту при измерении его у одних и тех же спортсменов разными тренерами. Иными словами, на результатах тестирования не должны сказываться личные качества исследователя.

Определение объективности производится несколькими способами. Первый — это сравнение результатов, полученных разными экспериментаторами при тестировании одних и тех же спортсменов. При этом сопоставляют средние арифметические и их стандартные отклонения. Если различия по этим оценкам находятся в пределах установленных ошибок измерений, то тест признается объективным.

Объективность теста может быть установлена и путем расчета различных коэффициентов.

Особенно важно соблюдение этого критерия стандартизации в современной практике наблюдений за технико-тактическим мастерством футбол и сто в. Известно, что в процессе таких наблюдений исследователь должен регистрировать все приемы, которые футболисты выполняют во время игры (короткие, средние и длинные передачи, ведения, перехваты, удары, игра головой и т. п.).

Уже не раз наблюдались случаи, когда два наблюдателя представляли материалы, в которых расхождение. достигало нескольких десятков процентов. Соблюсти принцип объективности можно при условии создания единой схемы наблюдения по типу той, что первоначально была создана Ю. А. Морозовым.

Существуют и другие критерии стандартизации, в. частности эквивалентность, разделительность и т. п., которые сами по себе достаточно важны, но их практическое определение возможно и необходимо при условии, что вначале оценены валидность, воспроизводимость и объективность.

Применение любого теста или их комплекса должно обязательно основываться на строгом учете этих критериев. Если, например, тест не проходил проверку на валидность,— тестирование превращается в пустую формальность, ибо при этом можно оценивать все что угодно, кроме того качества футболиста, которое нужно было измерить. Спортивная практика дает тому много подтверждений. Одним из широко распространенных силовых тестов является измерение силы кисти. Между тем, уже давно было найдено, что коэффициенты корреляции между результатами в силовых упражнениях, включающих функционирование наиболее крупных мышечных групп, и показателями силы кисти очень малы. Это означает, что данный тест измеряет только силу кисти и по нему нельзя судить о том, каковы силовые возможности остальных мышечных групп .

До недавнего времени достаточно популярными были и функциональные пробы (трехминутный бег, двадцать приседаний и т. п.), считавшиеся универсальными для оценки уровня подготовленности футболистов. И только расчеты по измерению корреляционных связей между спортивными результатами в соревновательном упражнении и результатами в этих пробах, продемонстрировали их низкую валидность.

И, наконец, еще об одном «универсальном» тесте для измерения скоростных способностей — беге на 100 м. Недавние исследования, проведенные на детях 7—16 лет и на спринтерах II и III спортивных разрядов, показали, что результат в беге на 100 м для этих контингентов людей отражает уровень развития специальной выносливости. А скоростные возможности футболистов, равно как и спортсменов в других игровых видах спорта, необходимо измерять в упражнениях гораздо меньшей длины (бег на 15 м с ходу, бег на 15 м со старта и т. п.).

Критерий воспроизводимости теста особенно важен в так называемых сравнительных экспериментах. Каждый тренер оценивает качество своей работы по разнице между предварительным и итоговым тестированием учеников. Если при этом использовать тесты, обладающие низкой воспроизводимостью, то выявить действительную разницу между начальным и конечным результатами в данном упражнении невозможно.

Одна из причин низкой воспроизводимости — это несовершенство методики измерения результатов теста. Для примера рассмотрим такие скоростные тесты, как бег на 15—40 м. Если измерять результаты в этих тестах с помощью фотоэлектронных или любых других автоматических измерительных систем, то их воспроизводимость будет высокой. Но массового распространения  устройства не получили, и повсюду фиксация времени производится с помощью обычного пружинного секундомера. И тогда а «истинное» время ученика накладываются «добавки» — ошибки секундомера и личные ошибки секундометриста, в некоторых случаях доходящие до 0,3—0,5 сек. Если «истинные» оценки времени изменяются по вполне определенному закону, то ошибочные вставляющие каждого измерения — по случайному. Это искажает величину коэффициента воспроизводимости.

Все сказанное относительно плохо воспроизводимых тестов овсе не означает, что они должны быть изъяты из арсенала контрольных упражнений педагога. Нужно выяснить причину изкой воспроизводимости и попытаться устранить ее, изменив методику выполнения теста или способ измерения и т. п.

Причина низкой объективности теста кроется прежде всего том, что не унифицированы методики тестирования и измерений. В принципе каждый тест должен проводиться разными педагогами одинаково. Обычно этого не бывает, и тогда всевозможные накладки» и ошибки разных тренеров не дают возможность сравнивать результаты тестирования и объективно оценивать деятельность каждого педагога.

После того как тесты прошли проверку в соответствии с критериями стандартизации, встает другой не менее важный вопрос: сколько нужно тестов для того, чтобы охарактеризовать состояние спортсмена или какой-либо системы организма? Конечно, всегда надо стремиться к тому, чтобы использовать максимум тестов. Однако в этом случае перед педагогом встают трудности и организационного и теоретического характера. Предположим, что наиболее полно оценить силовые качества футболиста можно с помощью 20 тестов. В число этих тестов входит измерение максимальной силы и ее градиентов практически во всех крупных мышечных группах. Чтобы провести один тест, нужно приобрести и настроить аппаратуру, укрепить и проверить датчики, создать спортсмену условия для проявления максимума силы в определенном движении и т. п. И все это повторяется 20 раз. Уходит много времени, необходимо и большое количество подчас сложной и дорогостоящей аппаратуры. Кроме того, если измерения проводятся :лишком долго, то спортсмен устает, и надежность тестов, которые измеряются в конце тестирования, резко падает. Избежать всего этого вполне возможно, если учитывать следующее обстоятельство. Тесты обладают разной информативностью, например, если 20 тестами оценивать уровень развития силовых качеств, то это вовсе не означает, что каждый тест вносит в суммарную оценку 5% вклада. Методами многомерного статистического анализа можно установить, что одни тесты дают вклад 15—20%, другие 1—2%. Это означает, что из 20 тестов нужно отбирать только те, которые обладают высокой информативностью. Кроме того, все тесты находятся в определенной взаимосвязи, причем некоторые из них очень тесно коррелируют друг с другом, образуя группы по нескольку тестов в каждой. Из таких групп надо выбрать 1—2 теста, ибо они дадут ту же самую информацию, что и остальные. Подобный подход позволяет уменьшить число тестов с 20 до 5—7. При этом потеря информации может быть незначительной: если 20 тестов дают 100% информации о интересующем нас качестве, то 5--7 могут дать 60—80%.

Еще одно замечание о методике тестирования. Предлагая спортсмену выполнить какой-либо тест, мы пытаемся оценить максимальный уровень развития двигательных качеств. Выполнение такого теста требует от спортсмена проявления и волевых качеств, Причем на самом высоком уровне. Таким образом, при использовании так называемых «максимальных тестов» оцениваются:

1. Уровень развития двигательного качества.
2. Волевые качества.

Может получиться так, особенно при тестировании выносливости, что спортсмен с высоким уровнем развития этого качества покажет в тесте меньший результат, чем спортсмен с более низким уровнем выносливости, но обладающий сильной волей. Поэтому нужно подбирать так называемые субмаксимальные тесты, в которых не требуется предельного проявления волевых качеств. В виде примера можно сослаться на тест, отражающий уровень развития выносливости,— максимальное потребление кислорода. Спортсмен способен потребить максимум кислорода только во время длительной работы максимальной интенсивности, при которой ЧСС поддерживается на уровне 180—190 ударов в минуту. Работать так очень трудно, и необходимо проявлять значительные волевые усилия, чтобы поддержать заданный темп. Можно значительно облегчить тестирование, если основываться на следующем факте. Ученые установили, что при увеличении ЧСС со 140 до 180—190 ударов линейно увеличивается потребление кислорода. Зная потребление кислорода в работе с ЧСС 140—150 ударов, несложно рассчитать, каким оно будет при работе с ЧСС 180 ударов. Работать (даже длительно) с ЧСС 140 ударов сравнительно легко, и поэтому тестирование в этом случае проходит безболезненно для спортсмена.

Измерения должны проводиться в стандартных условиях, т. е. в одном и том же месте, в одинаковое время. Перед измерениями спортсмен должен провести разминку. Его нужно ознакомить с содержанием теста. Перед основным тестированием выполняются 2—3 пробные попытки (если тест трудоемкий, то такие попытки могут не проводиться).

Важным моментом тестирования является измерение результатов в тесте. От того, как точно это сделано, зависит конечная оценка измеряемой функции. В спортивно-педагогической практике каждое измерение включает в себя по меньшей мере три величины. Первая — это так называемая истинная оценка измеряемого объекта. Она отражает его действительное состояние, но зарегистрировать нам ее никогда не удается. Это происходит потому, что истинную оценку искажают две другие составляющие
работу по совершенствованию столь важного компонента подготовленности футболиста, как быстрота бега.
3. Прыжок в высоту с места, отталкиваясь двумя ногами,— для оценки прыгучести.
4. Степ-тест — для оценки выносливости.
Для оценки этого же качества применяются такие тесты, как максимальное потребление кислорода (МПК) и максимальная анаэробная мощность (МАМ).

Оценивать ловкость футболистов с помощью специальных тестов довольно трудно. Прежде всего потому, что трудно подобрать тест, который бы реально воспроизводил действительные игровые ситуации.

Для весьма приближенной оценки того, что мы условно называем ловкостью (или координационными способностями), можно использовать тесты, в которых футболисты должны по заданию воспроизвести определенные величины силовых, пространственных и временных характеристик движения (например, прыгнуть вверх на высоту, равную 25—50% от максимальной, послать мяч на 10, 15, 20 м и т. п.).

Техническое мастерство спортсмена можно оценить несколькими путями. Наиболее простой из них — это, визуальная оценка техники движений (на глаз). В некоторых видах спорта такой способ остается до сего времени единственным. Так измеряют техническое мастерство в футболе, гимнастике, акробатике, фигурном катании и некоторых других видах спорта. Однако о техническом мастерстве футболиста лучше всего говорят следующие показатели (по В. М. Зациорскому):
1. Объем техники, или количество действий (приемов), которые может выполнить спортсмен.
2. Разносторонность действия, т. е. то, насколько используемые игроком движения (приемы) разнообразны.
3. Эффективность техники движений.

Показатели объема техники важны по двум причинам. Во-первых, они тесно связаны с уровнем развития двигательных качеств. Это значит, что чем большим количеством движений владеет спортсмен, тем он сильнее, быстрее и выносливее. Во-вторых, большой объем техники дает спортсмену, владеющему им, определенные преимущества перед соперником. Он может выиграть поединок, применив прием, на который у соперника нет соответствующего контрприема.

По предложению Ю. А. Морозова в футболе объем техники оценивают по следующим показателям: короткие и средние передачи назад и поперек поля, короткие передачи вперед, длинные передачи, отбор, перехват, игра головой, удары в ворота, штрафные и угловые удары. Все эти приемы выполняются футболистами в игре, и количество их колеблется от 600 до 1000. Предполагают, что если команда за игру выполнила 800—900 приемов, то активность ее была на высоком уровне. Заметим, правда, что в каждом конкретном случае нужно тщательно анализировать слагаемые этой суммы. Может оказаться так, что прирост в объеме был достигнут за счет бесцельного и длительного розыгрыша. Поэтому но всех случаях стенографический анализ игры должен дополнять- ем качественным анализом тренера.

То же самое можно сказать и о таком показателе технического мастерства, как разносторонность техники. Этот показатель характеризует разнообразие двигательных навыков. Предположим, что у спортсмена большой объем техники, но почти все упражнения, которыми он владеет, однообразны. Например, используются толь¬ко приемы защиты или только приемы нападения. В этом случае выиграть поединок с соперником с разносторонней техникой очень трудно. Спортсмен, о котором можно сказать, что он разносторонне технически подготовлен, обладает, как правило, не просто высоким уровнем двигательных качеств, но гармоничным их развитием. Кроме того, во время соревнований такой спортсмен практически всегда «навязывает» свою тактику сопернику, контролируя его действия разнообразными ответами.

Один из способов оценки эффективности — это сопоставление спортивного результата с потенциальными возможностями спортсмена. В данном случае они определяются уровнем развития двигательных качеств. Обычно сопоставляются результаты в двух упражнениях: в технически сложном и технически простом, которые требуют проявления одних и тех же двигательных качеств. Например, оценивается разница между результатами в беге на 20 м и при выполнений того же бега, но с ведением мяча.

Наиболее распространенный способ оценки эффективности техники в футболе — вычисление коэффициента эффективности (КЭ), который рассчитывается как отношение правильно (безошибочно) выполненных приемов ко всем приемам. При этом в зависимости от целей расчета КЭ он может быть обобщенным или частным. Обобщенный КЭ рассчитывается сразу для всех приемов, которые выполнял футболист в игре. Например, Ф. Беккенбауэр в матче чемпионата мира 1974 г. выполнил за игру 117 приемов и только в 7 допустил ошибку. Его обобщенный КЭ = 0,93. В этой же игре спортсмен сделал 33 ведения и ни разу здесь не ошибся; 6 перехватов, из которых два —с ошибкой. Частные КЭ: для ведений = = 1,0, для перехватов = 0,66.

Коэффициенты эффективности для игроков различных амплуа различны. У защитников хорошим КЭ считается 0,85, у полузащитников — 0,75—0,80, у нападающих — 0,65—0,70.
После того как оценены физическое состояние спортсмена и его технико-тактическое мастерство, можно приступать к планированию тренировочной работы.

Комментариев нет:

Отправить комментарий