Russian
| English
"Куда идет мир? Каково будущее науки? Как "объять необъятное", получая образование - высшее, среднее, начальное? Как преодолеть "пропасть двух культур" - естественнонаучной и гуманитарной? Как создать и вырастить научную школу? Какова структура нашего познания? Как управлять риском? Можно ли с единой точки зрения взглянуть на проблемы математики и экономики, физики и психологии, компьютерных наук и географии, техники и философии?"

«ЕГЭ КАК КАТАЛИЗАТОР КРИЗИСА РОССИЙСКОГО ОБРАЗОВАНИЯ» 
Г.Г. Малинецкий, А.В. Подлазов

Такая организация выпускного экзамена имеет одно, несомненно, позитивное следствие: все его задания должны выбираться изоткрытого банка . Исключив процедуру пересчета баллов после экзамена, мы вынуждены заранее гарантировать равносложность его вариантов. Но для этого надо провести калибровку его заданий, т.е. убедиться в том, что количество начисляемых за их выполнение баллов, сообразно их сложности. А калибровка заданий невозможна без их предъявления для выполнения на контрольных, олимпиадах, пробных экзаменах или экзаменах прошлых лет [21] . Но однажды предъявленные задания неизбежно попадут в открытый доступ, в силу чего становятся бессмысленными попытки их скрывать.

Открытость банка заданий имеет массу положительных следствий. Во-первых, это сократит возможности организаторов егэ превращать оплаченные деньгами налогоплательщиков кимы в свою интеллектуальную собственность, стращая копирайтным законодательством всякого, кто пытается их обнародовать. Во-вторых, это позволит на ранней стадии выявить и элиминировать некорректные задания за счет возможности для любого желающего проверить их и дать им оценку. Ну, а в-третьих, исчезнет проблема утечки экзаменационных материалов, поскольку лучшая защита секретной информации – отсутствие секретности или хотя бы минимизация объемов закрытой информации [22] .

Описанные выше методики получения оценок для обоих видов экзамена устроены значительно логичнее и проще, чем инструментарий теории параметризации и моделирования педагогических тестов. Более того, они лишают модель Раша и ее расширения одного из их главных преимуществ, которым принято считать возможность построить не порядковую , аметрическую шкалу выставляемых баллов. Если для элементов порядковой шкалы имеют смысл только операции сравнения(«хуже», «лучше», «одинаково»), то в случае метрической приобретает смысл и операция вычисления разности . Это означает, что для метрической шкалы цена каждого очередного балла одна и та же. То, чем исчисляется эта цена, и определяет логику построения шкалы.

Для шкалы, основанной на модели Раша, балл – это изменение логита знаний на определенную величину. Для шкалы, которая выше была предложена для выпускного экзамена, балл – это владение определенной долей школьной программы в рамках образовательного стандарта. Ну, а для шкалы, предложенной для вступительного экзамена, балл – это процент обойденных конкурентов. То есть, все эти три шкалы метрические. Однако есть и разница. Данное свойство, достающееся первой из шкал просто в силу методики ее построения, далее никак не может быть использовано, поскольку вне тестологических моделей логиты знаний никакого смысла не имеют. Шкале вступительного экзамена метричность достается столь же легко, но зато в качестве бонусов она дает постоянную дифференцирующую способность экзамена и возможность частично скомпенсировать различия в социально-экономических условиях регионов, где обучались экзаменуемые. Обеспечение метричности шкалы выпускного экзамена требует определенных предварительных усилий, но они не пропадают втуне. Дополнительным преимуществом этой шкалы является то, что она является еще и нормированной , т.е. в ней естественным образом определено начало отсчета, что не позволяет ей «не заметить» изменений общего уровня образования.

Сколько баллов в стобалльной шкале

Одной из важных положительных черт егэ, которой традиционно уделяется немалое внимание при его пиаре, считается переход от традиционной «пятибалльной» шкалы к качественно более точной стобалльной. Однако действительно ли кимы единого экзамена позволяют производить оценивание подготовленности с такой высокой точностью?

Любой прибор имеет погрешность измерений, которая не уменьшается от измельчения градуировки его шкалы. Можно было пересчитывать оценки егэ и к тысячебалльной шкале – стали ли бы они от этого точнее? Мелкая градуировка спасает только от ошибок округления, но не от ошибок измерения.

Результат любого измерения подвержен неизбежным флуктуациям. Измерение подготовленности – не исключение. При одном и том же ее уровне экзаменуемые могут получить разные итоговые баллы, распределение которых характеризуется определенными значениями математического ожидания m и дисперсии . И нет никаких оснований считать тех экзаменуемых, чей балл попадает в интервал от m - до m + , различающимися по уровню подготовленности. В пределах погрешности теста им всем можно приписать балл m . Это накладывает ограничение на количество различимых градаций оценки G , каждой из которых должен соответствовать диапазон разыгрываемых балов шириной 2.

Естественным способом повышения точности является проведение множественных измерений – в данном случае – предъявление экзаменуемым тестов, состоящих из многих заданий. По мере роста числа разыгрываемых баллов K , дисперсия итогового балла будет возрастать пропорционально K (в предположении, что баллы набираются независимо). Соответственно, максимально возможное количество различимых градаций описывается формулой

,

где c – некоторый коэффициент. Заметим, что это ограничение носит фундаментальный характер и не связано со структурой теста и методикой пересчета баллов при условии, что они корректны. Их некорректность может неопределенно сильно уменьшить величину G .

Потеря градаций оценки может быть связана как с эффективным уменьшением количества разыгрываемых первичных баллов K , так и с внесением в тестовый балл случайных искажений, которые раздувают дисперсию, уменьшая тем самым коэффициент c . При проведении егэ каждый из указанных способов был применен аж дважды.

Уменьшение числа разыгрываемых баллов обусловлено наличием в егэшных кимах как заданий-угадаек, за которые есть шансы получить баллы, ничего не зная, так и заданий с политомическим исходом, допускающих непоследовательное преодоление ступеней, в результате чего частичный балл за задание можно получить несколькими различными способами, тогда как модель предусматривает только один. И то, и другое приводит к систематическому завышению результатов экзамена по сравнению с реальным уровнем экзаменуемого, т.е. некоторое количество баллов, начисляемых просто так, фактически выводится из розыгрыша.

Искажения в тестовый балл вносятся как за счет различной сложности вариантов, которую не компенсирует усредненная шкала пересчета баллов, так и за счет использования заданий, оцениваемых из разного числа баллов, что лишает смысла измеряемые параметры модели частичного оценивания. В первом случае оказывается существенным, какой именно вариант выполнял экзаменуемый, во втором – на каких именно заданиях был набран первичный балл. С точки зрения общего итога, эти индивидуальные обстоятельства оказываются случайными факторами, не поддающимися учету.

Описанные практические ошибки, сокращающие количество различимых градаций итоговой оценки, являются в принципе устранимыми. Поэтому попробуем понять, как велико может быть количество градаций в том гипотетическом случае, когда они устранены, т.е. найдем ограничение величины G сверху.

Можно показать, что если тест состоит только из заданий с дихотомическим исходом (оцениваемых из одного балла), то значение c не превосходит величины 1,0 — 1,2 (рассчитанной в предположении, что разброс логитов знаний составляет 5 — 7 единиц или, что то же самое, различие экзаменуемых по знаниям не превышает 2 — 3 порядков). Однако данная величина коэффициента на практике не достигается, чему есть несколько причин.

  • Во-первых, приведенная верхняя оценка c соответствует весьма специфической структуре теста, при которой все задания имеют равную или почти равную сложность. Для разумно организованных тестов, в которых задания существенно варьируются по сложности, коэффициент будет несколько меньшим.
  • Во-вторых, в любом реальном тесте разные задания, вообще говоря, измеряют разные сущности, что неизбежно повышает погрешность итогового результата и снижает значение c . И хотя для кимов единого государственного экзамена внутренняя согласованность теста весьма высока [23] , указанное обстоятельство всё же нельзя сбрасывать со счетов.
  • В-третьих, необходимо учитывать наличие заданий с политомическим исходом (оцениваемых более чем из одного балла). Части таких заданий не являются независимыми. В силу этого успешное выполнение одной части обычно повышает шансы на успешное выполнения остальных частей. И, наоборот, ошибка, допущенная в одной части, снижает шансы справиться с остальными. Наличие подобной корреляции увеличивает дисперсию балла, полученного за задания, оцениваемые из нескольких баллов, по сравнению с суммарным балом за соответствующее количество однобалльных заданий. А значит, количество различимых градаций итоговой оценки еще более сокращается.

Вряд ли возможно напрямую учесть влияние всех описанных факторов. Однако можно воспользоваться следующей косвенной оценкой. Традиционный экзамен по математике, структура которого была оптимизирована для обеспечения 4 различимых градаций итоговой оценки, обычно состоял из 5 — 6 заданий, выполнение каждого из которых могло оцениваться из 3 — 5 псевдобаллов: «+», «+/–», «+/2», «–/+», «–» (с возможным отказом от одной или двух промежуточных ступеней). Это соответствует K 18 — 25. Такое количество разыгрываемых баллов обеспечивает 4 градации оценки при значении c 0,8 — 0,9, которое в свете сказанного выше представляется заслуживающим доверия.

Максимальный балл K ощутимо варьируется для егэ по различным предметам. Так, в 2008–10 гг. на егэ по математике разыгрываются 30 — 37 баллов (что соответствует 5 различимым градациям оценки), по литературе и информатике – 39 — 45 баллов (5 — 6 градаций), по физике – 50 баллов (6 градаций), по химии, биологии, географии, истории, обществознанию и русскому языку – 59 — 69 баллов (6 — 7 градаций), по иностранным языкам – 80 баллов (7 — 8 градаций) [24] .

Таким образом, если не принимать в расчет дополнительное уменьшение величины G из-за безграмотного шкалирования и некорректной структуры тестов, то можно утверждать, что стобалльная шкала егэ реально содержит всего 5?8 различимых градаций оценки. Это, разумеется, больше, чем при проведении традиционного экзамена, однако чтобы довести это количество до декларируемых 100 градаций, нужно увеличить число предъявляемых заданий всего-навсего в несколько сот раз.

Следует ли на этом основании отказываться от стобалльной шкалы? Нет, не следует. Она удобна психологически, а ее явно избыточная точность помогает противостоять ошибкам округления. Однако восторгаться ею тоже особо не стоит.

Данный пример достаточно хорошо позволяет почувствовать разницу между масштабом егэшного пиара и тем положительным эффектом, который может быть достигнут хотя бы теоретически.

К сожалению, дела обстоят еще хуже. Упомянутые 5?8 градаций оценки соответствуют всей шкале итоговых баллов, но целиком она никогда и нигде не используется. При конкурсном отборе в любой вуз за места в нем конкурируют абитуриенты с оценками, принадлежащими диапазону, который значительно уже 100 баллов. Абитуриенты с оценкой ниже определённого порога, либо вообще не допускаются к конкурсу [25] , либо не имеют никаких шансов на поступление. Диапазон результатов, на котором происходит конкуренция за места в конкретном вузе, оказывается вдвое–втрое меньше полной ширины шкалы. Соответственно, реально используемое количество различимых градаций оценки сокращается до 2?3, при том, что традиционный вступительный экзамен, ориентированный по сложности на конкретный контингент поступающих, уверенно обеспечивал 3 различимых «положительных» оценки (получившие двойку из конкурса выбывали). Таким образом, несмотря на значительно большее число заданий, точность единого государственного экзамена чуть ниже, чем у традиционных вступительных экзаменов , что есть прямое следствие совмещения функций выпускного и вступительного экзаменов. При этом обществу рассказывают про значительно возросшую точность.

Так и кончаются школьные годы…

Одной из официально декларировавшихся целей введения единого государственного экзамена была «разгрузка выпускников-абитуриентов через сокращение числа испытаний за счет совмещения выпускных экзаменов в школах и вступительных экзаменов в вузах». Функции егэ как итоговой аттестации постепенно сходят на нет, результатом чего стала фактическая отмена выпускного экзамена (надо полагать, это и имелось в виду под разгрузкой выпускников).

Чтобы выполнять функции итоговой аттестации, экзамен должен сдаваться всеми выпускниками [26] . Однако с 2009 г. егэ обязателен только по русскому языку и математике, а по остальным предметам единый экзамен сдается лишь по желанию. Естественно, те выпускники, которым эти предметы не нужны для поступления в вуз, их и не сдают [27] . Более того, они просто прекращают учить эти предметы, поскольку никаких альтернативных форм итоговой аттестацией после отмены выпускных экзаменов не введено.

Еще недавно как одно из важнейших достоинств егэ превозносилась его дифференцирующая способность, якобы, значительно более высокая, чем у оценок среднестатистического учителя. Однако с 2009 г. выпускной экзамен свелся к недифференцированному зачету, который реально проводится только по двум предметам.

Тем не менее, даже в таком виде, рассмотрение результатов егэшной аттестации дает богатую почву для размышлений.

Статистика знает всё

Прежде чем приступать к анализу результатов единого экзамена в его выпускной ипостаси, необходимо сделать одно важное замечание. Существуют две разных статистики результатов егэ. Одна публикуется в ежегодных аналитических отчетах «Результаты единого государственного экзамена» [28] Федерального института педагогических измерений (ФИПИ), а вторая размещается на Официальном информационный портале (ОИП) единого государственного экзамена в разделе «Статистика ЕГЭ» [29] .

По некоторым позициям содержание этих источников разнится радикально. Более того, разночтения в содержании предварительной и итоговой информации ОИП порой выходят за пределы любых мыслимых уточнений, чему никто не потрудился дать хоть какое-то объяснение. Скорее всего, имеет место включение в окончательную статистику лиц, не являющихся выпускниками текущего года. По крайней мере, тот факт, что суммарное число сдаваемых добавленными лицами экзаменов (около 250 тыс. ежегодно) оставалось практически неизменным в 2007-09 гг., косвенно подтверждает данное предположение. Также есть основания полагать, что в статистике ФИПИ могли быть не учтены лица, сдававшие егэ досрочно. Кроме того, результаты егэ в аналитических отчетах ФИПИ приведены без учета пересдач русского языка и математики в 2009 г.

К сожалению, данных только какого-то одного источника не достаточно для анализа темы аттестации. Поэтому мы будем пользоваться обоими источниками, указывая их в скобках. Читателю не следует пугаться, встретив цифры, отличающиеся от известных ему, хотя возможные расхождения порой могут быть фантастичны. Так, например, доля лиц, получивших двойки по математике и русскому языку в 2009 г., составляет то ли 7,0% и 6,5% (ФИПИ), то ли 3,7% и 3,0% (ОИП), а по иностранному языку в 2008 г. – то ли 6,6% (ФИПИ), то ли 17,7% (ОИП). Впрочем, столь большой разброс – это пиковые ситуации. В большинстве случаев различия являются не очень существенными и не влияют на общую картину.

Я угадаю эту мелодию с двух нот

Часть A егэшных кимов представляет собой тест-американку , т.е. состоит из заданий с выбором одного правильного ответа из четырех (трех для некоторых заданий экзамена по иностранным языкам) предложенных вариантов. Соответственно, у каждого четвертого (третьего) задания правильный ответ может быть просто угадан. Причем наличие хотя бы фрагментарных познаний, позволяющих отбросить часть вариантов как заведомо неверные, существенно повышает вероятность угадывания верного. Более того, некоторые задания-угадайки сформулированы так, что возможно исключить все неверные варианты, не зная вообще ничего, а полагаясь лишь на здравый смысл и предположение, что правильный ответ должен быть ровно один.

Схожим образом построен и ряд заданий части B экзамена. Номинально они предполагают краткий ответ, однако фактически во многих случаях в ответе не оказывается ничего, что бы не содержалось в условии. Требуется или отметить несколько правильных ответов из приведенного набора, или упорядочить приведенные варианты в соответствие с некоторым критерием, или сопоставить друг другу элементы двух наборов [30] , или выписать из текста какое-то слово или предложение. Во всех этих случаях сохраняется непренебрежимая вероятность угадывания правильного ответа, равно как и возможность существенно повысить ее, если знать хоть что-то.

Приведенный список угадаек с кратким ответом уместно дополнить еще одним типом заданий, требующих поставить приведенное иностранное слово в нужную форму. Здесь тоже делается выбор из сравнительно небольшого числа возможных вариантов. И хотя они и отсутствуют в условии, эта дополнительная сложность компенсируется тем, что половина заданий части A на экзамене по иностранным языкам предполагает выбор ответа всего из трех вариантов, а не из четырех.

Доля разыгрываемых баллов, приходящихся на задания–угадайки, кардинально сказывается на результатах итоговой аттестации. Ее анализ уместно проводить отдельно для 2009 г. и для предшествующих лет, поскольку с этого года егэ по русскому языку и математике стал всеобщим, а по прочим предметам – необязательным.

Эксперимент по введению егэ: 2006-08 годы

Школьные предметы очень сильно различаются по доле заданий-угадаек в части B (см. табл.). Их совсем нет в кимах по математике и почти нет – по литературе. В кимах по физике и информатике угадаек уже побольше, но они еще пребывают в меньшинстве, начиная доминировать в кимах по географии, истории, химии, обществознанию и русскому языку. Наконец, часть B кимов по иностранным языкам (в приведенной выше трактовке) и биологии полностью состоит из таких заданий.

На егэ по математике и литературе 2006-08 гг. задания-угадайки частей A и B в сумме давали не более 33% первичных баллов, тогда как для остальных предметов этот показатель составлял 58 — 75% (см. табл.). В этом, по-видимому, и кроется причина того отрыва, с которым в эти годы математика и литература обгоняли другие предметы по проценту неудовлетворительных оценок. Показать высокий результат, только гадая, конечно же, невозможно, но разница между двойкой и тройкой на егэ во многом определяется именно угадыванием.

Можно приближенно считать, что процент двоек в 2006-08 гг. был прямо пропорционален проценту первичных баллов, приходящихся на полноценные задания , которые не допускают угадывания ответа. Зависимость показана на рис. 3. В рамках однопараметрической (без свободного члена) линейной регрессионной модели свыше 87% дисперсии доли двоек, полученных на егэ 2008 г., объясняется вариацией доли полноценных заданий. В 2007 и 2006 гг. коэффициент детерминации оказывается заметно ниже – соответственно, 49% и 29%, что, скорее всего, обусловлено неунифицированным способом пересчета баллов для разных предметов в эти годы.

Рис. 3. Зависимость доли неудовлетворительных оценок от стоимости полноценных заданий (ФИПИ)

Сплошная линия – линейная регрессионная зависимость для данных за все три года, проведенная через начало координат.
Точки в правой верхней части рисунка соответствуют егэ по математике и литературе, а в левой нижней части – по остальным предметам.
Особо следует отметить егэ по литературе, в кимах которого с 2008 г. не стало части A, где ранее разыгрывалось почти 30% первичных баллов. В результате этого литература смогла обойти математику по двойкам (самая правая и верхняя точка).
При объединении данных за три последних года коэффициент детерминации составляет 62% (см. рис. 3). Это достаточно много, чтобы утверждать, что сравнение результатов егэ по разным предметам позволяло характеризовать не различия в качестве их усвоения школьниками, а лишь различия в структуре кимов.

Егэ-2008. Результаты экзамена и особенности кимов

Предмет Двоек (ФИПИ) Первичных баллов на тройку Стоимость заданий-угадаек
части A частей A и B
Литература 25,5% 8,9% 0,0% 2,2%
Математика 23,1% 16,1% 33,3% 33,3%
Информатика 11,3% 27,5% 50,0% 57,5%
Иностранный язык 6,6% 31,0% 28,0% 60,0%
Обществознание 6,1% 30,6% 48,4% 62,9%
История России 10,0% 23,5% 47,1% 63,2%
Физика 9,7% 24,0% 60,0% 64,0%
Русский язык 11,2% 30,0% 51,7% 65,0%
География 8,9% 26,7% 51,7% 68,3%
Химия 10,4% 23,9% 44,8% 68,7%
Биология 6,7% 24,6% 52,2% 75,4%

Егэ в штатном режиме: 2009 год

В 2009 г. егэ по русскому языку и математики сдавала вся страна, что, казалось бы, позволяет судить о состоянии дел в российском образовании хотя бы в разрезе этих двух предметов. Попробуем понять, что же означает подтверждение освоения «основных общеобразовательных программ среднего (полного) общего образования в 2009 году» по этим предметам, без чего нельзя было получить аттестат.

Контрольно-измерительные материалы по математике в том году содержали 10 заданий части A с выбором ответа из четырех предложенных вариантов. При этом достаточно было дать всего 4 верных ответа, чтобы избежать двойки. Если не знать совсем ничего и расставлять крестики наугад, то пройти такую итоговую аттестацию можно примерно в 2 случаях из 9. Однако если знать хотя бы что-то, вероятность успеха можно существенно повысить.

Определим владение предметом как долю тех заданий с выбором ответа, которые экзаменуемый может осилить, и будем считать, что иначе он попросту гадает. В реальности, конечно, не всегда имеет место четкое разделение на «знаю» или «гадаю», а часто происходит отбрасывание некоторых неверных вариантов ответа и случайный выбор между оставшимися вариантами. Однако математически эти ситуации однозначно связаны. Так, если экзаменуемый справляется с заданием с вероятностью p , а в противном случае случайно выбирает один вариант ответа из n предложенных, то в среднем это эквивалентно уменьшению числа возможных вариантов до

.

Рис. 4 демонстрирует, как быстро вероятность подтвердить освоение общеобразовательной программы по математике, увеличивается по мере роста владения предметом. Видно, что крайне слабые знания обеспечивают довольно высокую вероятность успешной аттестации, которая достигает 50% при владении предметом на уровне всего 14%.

Рис. 4. Вероятность успешной аттестации по математике и русскому языку в зависимости от владением предметом

Для математики рассматривается только выполнение части A, а для русского языка – частей A и B с различными гипотезами относительно шансов на угадывание правильного ответа для заданий части B.
Учет возможности второй попытки связан с правом пересдачи предмета, освоение которого экзаменуемый не подтвердил с первого раза.

Ситуация с егэ по русскому языку не столь однозначна. Здесь почти нереально получить зачет, только расставляя наугад крестики, поскольку в 2009 г. было необходимо набрать 15 баллов, а в части A насчитывалось всего лишь 30 (однобалльных) заданий. Однако в кимах по русскому языку ответ на задания части B, в которой разыгрывалось еще 9 баллов, тоже выбирался из приведенного набора вариантов (в отличие от математики, где ответы в части B нужно получать самостоятельно) [31] . Эти варианты заведомо неравноценны, а их число непостоянно, в силу чего нельзя достоверно определить шансы на успех при угадывании ответов для заданий части B, но можно сформулированы следующие три гипотезы:

  • оптимистичная – шансы угадать такие же, как и для части A, т.е. 1:4;
  • реалистичная – шансы угадать примерно 1:10;
  • пессимистичная – шансов угадать нет вообще.

Как видно из рис. 4, переход от оптимистичной гипотезы к пессимистичной эквивалентен изменению владения предметом примерно на 5?7%, т.е. особой разницы между крайними гипотезами нет, и разумно опираться на промежуточную реалистичную.

Зависимости для математики и русского языка качественно довольно похожи, но количественно всё же различны, поэтому в простейшем случае уместно ориентироваться на точку пересечения графиков. Из ее положения можно сделать общий вывод, что 70% вероятность подтверждения освоения основных общеобразовательных программ по этим предметам обеспечивается владением ими на уровне лишь в 25%. А уровень владения в 33,3% (здесь n’ = 2, что соответствует пресловутому «попросим компьютер убрать два неверных ответа из четырех») поднимает вероятность успеха и вовсе до 80 — 90%.

Ценность подобной, с позволения сказать, аттестации близка к нулю. Однако организаторы егэ не были бы собой, если бы ограничились достигнутым. Правилами проведения единого государственного экзамена 2009 г. допускается однократная пересдача неудовлетворительной оценки. Возможность попытать счастья еще раз существенно повышает шансы на благоприятный исход (см. рис. 4), что не удивительно в ситуации, когда результат сдачи в основном зависит не от знаний, а от везения. За счет повторного бросания костей подтвердить освоение программы по математике при нулевых знаниях удается уже в 2 случаях из 5. Владение русским языком или математикой на уровне 25% обеспечивает аттестацию с вероятностью свыше 90%, а на уровне 33,3% – свыше 97%.

Пересдача проваленного егэ имела одно неожиданное пиар-следствие. На рис. 5 приведены распределения экзаменуемых по первичному баллу. Аналоги этих графиков, широко растиражированные в печати, принято трактовать как свидетельство фальсификации результатов экзамена. И впрямь, если выпускникам, которым чуть-чуть не хватает до тройки, набросить недостающие баллы, то график распределения слева от порога просядет, а справа – приподнимется. Однако к точно такому же эффекту приводит и легальная пересдача двоек. Так что дело здесь не столько в том, что результаты егэ были сфальсифицированы, сколько в том, что сам егэ изначально является фальсификацией измерений в сфере образования. Понятно, что если есть ненулевые шансы пройти аттестацию только за счет везения, то остается всего лишь сделать достаточное количество попыток. Коррекция графиков на рис. 5 позволяет оценить долю исправленных за один раз двоек на уровне 28% по русскому языку и 34% по математике (ОИП) [32] . Надо полагать, что если бы разрешили попробовать сдавать экзамены еще по нескольку раз, то двоек не осталось бы вовсе.

Рис. 5. Распределение участников егэ по русскому языку и математике по набранному первичному баллу (ОИП)

Оба графика демонстрируют практически вертикальный взлет, приходящийся на точку, отделяющую двойку от тройки. Такое поведение свидетельствует о чудесном превращении некоторого количества двоечников в троечников. Замена «испорченных» участков графиков гладкими кривыми дает 4,2% двоек для русского языка и 5,6% для математики против официальных значений в 3,0% и 3,7%, соответственно.
В качестве корректировочных кривых взяты парабола (для русского языка) и прямая (для математики), проведенные через опорные точки, помеченные стрелочками, и сохраняющие интеграл. Гладкая стыковка графиков позволяет предполагать удовлетворительное качество реконструкции.

Всё течёт туда, где ничего не меняется

Завершая обсуждение пригодности единого государственного экзамена для единообразной аттестации наиболее слабых выпускников, следует лишний раз обратить внимание на патологическое стремление организаторов егэ сбалансировать предметы по проценту двоек. Казалось бы, простейшим решением здесь было уравниванием доли заданий-угадаек в кимах по разным предметам.

Однако егэшники не ищут легких путей даже в деле очковтирательства. Поэтому ставка была сделана на снижение порогов получения выпускной тройки по наиболее проблемным предметам (см. табл. выше). Так, в 2008 г. для этого на егэ по литературе было достаточно набрать 9%, а по математике [33] – 16%. В тоже время на егэ по остальным предметам порог получения выпускной тройки составлял в том году 24-31% первичных баллов. Впрочем, уменьшение минимальных требований по математике и литературе не особо помогло – отношение суммарной стоимости заданий-угадаек к троечному порогу для этих предметов всё равно оставалось самым низким, а процент двоек – самым высоким.

В 2009 г. порог для тройки по математике был опущен в полтора раза, что, наконец-то, позволило свести количество двоек до общественно приемлемого уровня. А вот с литературой в том году произошла вещь в высшей степени нетривиальная. Снижать порог тройки здесь было уже невозможно [34] . И порог был поднят до уровня, даже более высокого чему у математики (15% разыгрываемых первичных балов против 11%). При этом процент двоек парадоксальным образом тоже сократился.

При более внимательном анализе ощущение чуда только усиливается. В 2008 г. экзаменуемые справлялись с 34?52% заданий части B кимов по литературе, а в 2009 г. – с 62?79% (ФИПИ). Эта часть не претерпела никаких существенных изменений ни по структуре, ни по содержанию. Тем не менее, самое простое ее задание оказалось в 2008 г. субъективно сложнее, чем самое сложное в 2009 г.

Ситуация начинает проясняться, лишь если принять во внимание сокращение с 8,4% в 2008 г. до 6,2% в 2009 г. доли выпускников, сдававших егэ по литературе [35] (ОИП). Кроме нее уменьшение доли сдающих егэ, хотя и не столь значительное, продемонстрировали только география [36] (с 4,5% до 3,6%), математика (с 103,8% до 94,2%) и русский язык (с 109,4% до 99,4%), а для остальных предметов этот показатель возрос и порой весьма значительно. То, что произошло с егэ по литературе, лучше всего описывается притчей «купи козу – продай козу»: как только выпускной экзамен по этому предмету стал не обязательным, выпускники шарахнулись от него, как черт от ладана [37] .

Изменение субъективной сложности егэ интересно не только в контексте подтверждения освоения предмета, но и само по себе. Судить о субъективной сложности экзамена можно по виду графика интегрального распределения экзаменуемых по первичному баллу. По сравнению с 2008 г. субъективная сложность единого государственного экзамена в 2009 г. уменьшилась только для русского языка, математики и литературы, вернувшись для всех трех предметов на уровень примерно соответствующий 2007 г. Но если в первых двух произошло лишь незначительное уменьшение сложности, связанное, скорее всего, с приспособлением образовательной системы к формату егэ, то в случае литературы, как можно видеть из рис. 6, оно было гигантским. По всем остальным предметам субъективная сложность егэ изменилась незначительно. Систематический ее рост на демонстрирует только информатика (см. рис. 6), для которой количество сдающих увеличивается наибольшими темпами. Ее сдавали 1,7% выпуска в 2007 г., 3,0% – в 2008 г. и 7,2% – в 2009 г. (ОИП).

Рис. 6. Интегральное распределение участников егэ по литературе и информатике по набранному первичному баллу (ОИП)

Смещение кривой влево и вверх означает, что экзамен стал субъективно сложнее, а вправо и вниз, что – проще.
Экзамен по литературе отыграл в 2009 г. резкий рост сложности в 2008 г., вызванный исключением части A. Экзамен по информатике, напротив, от года к году становится сложнее.

Впрочем, даже не имея графиков экзамена иногда возможно составить представление об изменении его субъективной сложности. В 2010 г. происходит эпохальное события: из экзамена по математике полностью удалены задания-угадайки. Аналогичное изменение структуры кимов по литературе двумя годами ранее привело к резкому росту субъективной сложности егэ (см. рис. 6). И можно предсказать, что с математикой случится ровно то же самое. Это вызовет всплеск числа двоек, который не удастся демпфировать никаким снижением порога тройки.

Любые характеристики егэ, важные для его функционирования в качестве выпускного экзамена, варьируются год от года и предмет от предмета самым причудливым образом – в силу действия как объективных, так и субъективных факторов. Как при этом экзамен может не только считаться объективным измерителем чего бы то ни было, но и даже называется единым, понять решительно невозможно.