Логика · Арифметика · Теория доказательств

О математической индукции

Один и тот же принцип — «доказано для базы и для шага ⇒ доказано для всех» — принимает существенно разные логические формы в зависимости от языка и базовой теории: счётную схему аксиом в арифметике Пеано, единственную аксиому второго порядка в анализе, теорему в теории множеств. Здесь — путеводитель по этим формам, их взаимосвязям и границам; полные формулировки и доказательства — в PDF.

📄 Все доказательства этой страницы (включая теорему о равносильности и её метаматематические тонкости) — полный текст «О математической индукции» (PDF)

1. Формы индукции: от языка к языку

Индукция выглядит по-разному не потому, что математики каждый раз придумывают что-то новое, а потому, что выразительные возможности языка меняются: там, где нельзя квантифицировать по множествам, приходится довольствоваться схемой аксиом — отдельной аксиомой на каждую формулу.

Арифметика Пеано \(\mathsf{PA}\) — счётная схема
Квантификации по множествам в языке нет: для каждой формулы \(\varphi(a)\) (с параметрами) — своя аксиома.
\[\varphi[a/0] \land \forall x\,(\varphi[a/x]\to\varphi[a/Sx]) \to \forall y\,\varphi[a/y]\]
Привычнее записывать её через объём формулы \(X=\{x\mid\varphi(x)\}\) — но запись \(\forall X(\ldots)\) здесь лишь метазапись схемы, а не квантор второго порядка.
Анализ второго порядка \(\mathsf{Z}_2\) — единая аксиома
Квантификация по множествам разрешена языком напрямую, поэтому схема сворачивается в одну формулу:
\[\forall X\bigl(0\in X\land\forall x(x\in X\to Sx\in X)\to\forall y(y\in X)\bigr)\]
Мощность теории задаётся не самой этой аксиомой, а схемой свёртывания: чем шире класс формул \(\varphi\), для которых гарантировано существование \(X=\{x\mid\varphi(x)\}\), тем на больший запас множеств распространяется индукция.
Теория множеств \(\mathsf{ZFC}\) — следствие бесконечности
Индукция по \(\mathbb N\) — следствие аксиомы бесконечности (существование индуктивного \(\omega\)):
\[\exists X\bigl(\emptyset\in X\land\forall x\in X(x\cup\{x\}\in X)\bigr)\]
Трансфинитная индукция обобщает принцип на все ординалы:
\[\forall\alpha\bigl((\forall\beta{<}\alpha\;\varphi(\beta))\to\varphi(\alpha)\bigr)\to\forall\gamma\,\varphi(\gamma)\]
В \(\mathsf{ZFC}\) это уже теорема, а не аксиома — она следует из фундированности (регулярности) и схемы выделения.

Разновидности по сложности формул и параметрам

2. Пять равносильных принципов — и где равносильность ломается

В первопорядковом языке арифметики можно сформулировать пять на первый взгляд разных принципов. Часть из них равносильна друг другу уже в чистой логике, без единой арифметической аксиомы; другая часть требует минимальных фактов о последователе; связь с последним принципом — самая тонкая и метаматематически глубокая. Три сокращения, на которых всё держится:

\(\mathrm{Ind}(X)\)\(0\in X \,\land\, \forall x\,(x\in X\to Sx\in X)\) — индуктивность: условие локального шага
\(\mathrm{Prog}(X)\)\(\forall x\,([0,x)\subseteq X\to x\in X)\) — прогрессивность: замкнутость относительно начальных интервалов
\(\mathrm{Tot}(X)\)\(\forall x\,(x\in X)\) — тотальность: \(X\) содержит вообще всё
I
Локальная индукция
\(\forall X\bigl(\mathrm{Ind}(X)\to\mathrm{Tot}(X)\bigr)\)
I*
Возвратная (полная, course-of-values) индукция
\(\forall X\bigl(\mathrm{Prog}(X)\to\mathrm{Tot}(X)\bigr)\)
L
Принцип наименьшего элемента
\(\forall X\bigl(X\ne\varnothing\to\exists x\in X\,\forall y\in X\,(x\leqslant y)\bigr)\)
D
Принцип бесконечного спуска
\(\forall X\bigl(X\ne\varnothing\to\lnot(\forall x\in X\,\exists y\in X\,(y{<}x))\bigr)\)
B
Схема коллекции (по двуместному отношению \(\varphi(x,y)\), не через \(X\))
\(\forall a\bigl(\forall x{<}a\,\exists y\,\varphi(x,y)\to\exists z\,\forall x{<}a\,\exists y{<}z\,\varphi(x,y)\bigr)\)

Диаграмма связей

\(I^*\Leftrightarrow L\Leftrightarrow D\)
(O1),(O2),(O3)
(O1),(O2)
\(I\)
\(I\Delta_0\)
\(I\Delta_0\)
\(B\)

Три горизонтальные группы диаграммы устроены принципиально по-разному: левая пара стрелок — факт чистой логики (с точностью до трихотомии порядка); средняя пара использует лишь минимальные факты о последователе \(S\); правая пара опирается уже на индукцию \(I\Delta_0\) и доказывается заметно сложнее (Paris–Kirby). Подробности каждого перехода — ниже и в PDF.

\(I^*\Leftrightarrow L\Leftrightarrow D\) — факт чистой логики

Ключевое наблюдение: эти три принципа равносильны друг другу уже в чистом исчислении предикатов — без единой арифметической аксиомы, — если только \(<\) — строгий линейный порядок (нужна лишь трихотомия: для любых \(x,y\) верно ровно одно из \(x{<}y\), \(x{=}y\), \(y{<}x\)).

Набросок доказательства \(I^*\Leftrightarrow L\Leftrightarrow D\)

(a) \(I^*_{\lnot\varphi}\iff D_\varphi\). Схема \(I^*\) для формулы \(\lnot\varphi\) имеет вид \(A\to B\), где \(A\equiv\forall x(\forall y{<}x\,\lnot\varphi(y)\to\lnot\varphi(x))\), \(B\equiv\forall x\,\lnot\varphi(x)\). По закону контрапозиции \(A\to B\iff\lnot B\to\lnot A\) — чистая тавтология. Раскрывая отрицания по де Моргану и двойственности кванторов, \(\lnot B\) — это \(X\ne\varnothing\), а \(\lnot A\) после ещё одной контрапозиции внутри — это в точности \(\lnot(\forall x\in X\,\exists y\in X\,(y{<}x))\), то есть заключение \(D_\varphi\).

(b) \(D_\varphi\iff L_\varphi\) — при трихотомии \(\lnot(y{<}x)\) означает «\(y{=}x\) или \(x{<}y\)», то есть ровно \(x\leqslant y\); формулы \(D\) и \(L\) после раскрытия внутреннего отрицания совпадают буквально.

Поскольку класс формул замкнут относительно \(\varphi\mapsto\lnot\varphi\), отсюда следует равносильность полных схем \(I^*\iff D\iff L\). Ни число \(0\), ни операция \(+1\) в доказательстве не используются — только линейность \(<\).

\(I\Leftrightarrow I^*\) — роль минимальной арифметики последователя

Связь \(I\) с тройкой \(I^*,L,D\) устроена иначе: она неотделима от последователя \(S\) и потому не может быть чисто логическим фактом. Нужны три элементарных аксиомы о согласовании \(<\) и \(S\) (обозначим их (O1)–(O3); вместе с рекурсивными уравнениями для \(+,\times,S\) они образуют теорию \(\mathsf{PA}^{\mathrm{rec}}_-\) — арифметику Робинсона в исходной рекурсивной форме):

(O1) ¬(x<0) — 0 наименьший (O2) y<Sx ↔ y⩽x (O3) x≠0 → ∃y(x=Sy)
Набросок доказательства: (O1)–(O3) ⇒ \(I^*\Rightarrow I\); (O1)–(O2) ⇒ \(I\Rightarrow I^*\)

Лемма. Из (O1)–(O3): \(\mathrm{Ind}(X)\to\mathrm{Prog}(X)\). Пусть \([0,x)\subseteq X\). По (O3) либо \(x{=}0\) (тогда \(x\in X\) по первому конъюнкту \(\mathrm{Ind}(X)\)), либо \(x{=}Sz\): тогда по (O2) \(z{<}Sz{=}x\), значит \(z\in[0,x)\subseteq X\), и по второму конъюнкту \(\mathrm{Ind}(X)\) получаем \(Sz{=}x\in X\).

\(I^*\Rightarrow I\). Из \(\mathrm{Ind}(X)\) по Лемме получаем \(\mathrm{Prog}(X)\); применяя \(I^*\), получаем \(\mathrm{Tot}(X)\). Аксиома (O3) используется здесь единственный раз — в разборе «\(x\) есть \(0\) или последователь».

\(I\Rightarrow I^*\) (без (O3)!). Пусть \(\mathrm{Prog}(X)\). Определим \(Y=\{x\mid[0,x)\subseteq X\}\) — максимальный начальный интервал внутри \(X\). Тогда \(Y\subseteq X\) сразу по определению \(\mathrm{Prog}(X)\). Далее \(\mathrm{Ind}(Y)\): база \(0\in Y\) — по (O1) \([0,0)=\varnothing\subseteq X\); шаг — если \(z\in Y\), то \(z\in X\) (по \(Y\subseteq X\)), и по (O2) \([0,Sz)=[0,z)\cup\{z\}\subseteq X\), то есть \(Sz\in Y\). Применяя \(I\) к \(Y\), получаем \(\mathrm{Tot}(Y)\), а вместе с \(Y\subseteq X\) — искомое \(\mathrm{Tot}(X)\).

Асимметрия здесь содержательна: направление \(I^*\Rightarrow I\) существенно использует все три аксиомы, причём именно (O3) — в разборе случаев; направление \(I\Rightarrow I^*\) обходится (O1)–(O2) и вовсе не использует (O3). Модель ниже показывает, что это не случайность.

Модель, где (O3) ломается: \(I^*\) есть, а \(I\) — нет

Возьмём носителем ординал \(\omega+\omega\) — две последовательные копии \(\mathbb N\) с обычным порядком, но последователь определим отдельно внутри каждой копии: \(S(n)=n{+}1\) в первой, \(S(\omega{+}n)=\omega{+}n{+}1\) во второй. Функция \(S\) всюду определена и инъективна, (O1)–(O2) выполнены — но элемент \(\omega\) не есть \(S(y)\) ни для какого \(y\): это ровно то место, где ломается (O3).

Первая копия ℕ
0
S→
1
S→
2
S→
3
···
Вторая копия ℕ — ω не является S(y) ни для какого y
ω
S→
ω+1
S→
ω+2
···

Множество \(X\) = «первая копия \(\mathbb N\)» удовлетворяет \(\mathrm{Ind}(X)\) (содержит 0, замкнуто относительно \(S\)), но \(X\ne\omega{+}\omega\) — значит \(I\) для этого \(X\) не выполнено. При этом \(\omega+\omega\) — честный ординал (вполне упорядоченное множество), так что трансфинитная индукция верна в нём для произвольных подмножеств носителя — а значит \(I^*\) (и вместе с ним \(L\), \(D\)) здесь выполняются, причём в подлинно втором порядке, без всяких оговорок про схему.

Осторожному читателю: не значит ли это, что индукция навязывает модели быть вполне упорядоченной?

Нет: существуют нестандартные модели \(\mathsf{PA}\), в которых полная схема \(I\) (а с ней и \(I^*,L,D\) как схемы) выполнена, но сама модель, если смотреть на неё извне, вполне упорядоченной не является — в ней есть (неопределимые в языке \(\mathsf{PA}\)) подмножества без наименьшего элемента. Противоречия нет: как схема аксиом, \(I^*\) гарантирует наименьший элемент лишь для подмножеств, определимых формулой языка \(\mathsf{PA}\); на «неправильные» подмножества нестандартной модели схема просто не распространяется. В примере выше \(I^*\) законно потребована для абсолютно всех подмножеств именно потому, что \(\omega+\omega\) по построению стандартна.

Схема коллекции \(B\) — самая тонкая связь

Связь \(B\) с \(I\) не сводится ни к чистой логике, ни к минимальной арифметике последователя. Внутри слабой базовой теории \(\mathsf{PA}^-\) (аксиомы дискретного упорядоченного полукольца без индукции) схема \(B\) сама по себе не влечёт \(I\). Но относительно базовой индукции \(I\Delta_0\) связь восстанавливается и образует строгую иерархию (Paris–Kirby, 1978):

\[I\Sigma_n \;\to\; B\Sigma_n \;\to\; I\Sigma_{n-1}\qquad(n\ge1)\]

а на уровне полных схем — \(I\iff B\) относительно базы \(I\Delta_0\). Доказательство этого перехода заметно сложнее двух предыдущих и не приводится здесь целиком — полностью оно разобрано в PDF.

3. Что даёт индукция — и где она заканчивается

Ниже — набор утверждений, чья доказуемость существенно завязана на силу индукции: одни требуют лишь самой слабой её формы, другие независимы от полной схемы \(I\) арифметики Пеано. Статус указан в терминах подсистем арифметики (\(I\Sigma_n\), \(I\Delta_0\)) и обратной математики (\(\mathsf{RCA}_0\), \(\mathsf{WKL}_0\), \(\mathsf{ACA}_0\), \(\mathsf{ATR}_0\)).

УтверждениеСтатус доказуемости
Принцип Дирихле (Pigeonhole) |A|>|B| ⇒ нет инъекции A→B не в \(I\Delta_0\) Paris–Wilkie–Woods, Ajtai (1988): не доказуем даже для \(\Delta_0\)-определимых функций — демонстрирует крайнюю слабость \(I\Delta_0\).
Лемма Кёнига о бесконечном пути бесконечное конечно-ветвящееся дерево содержит бесконечный путь ≡ \(\mathsf{WKL}_0\) для бинарных деревьев (⇔ компактность отрезка); ≡ \(\mathsf{ACA}_0\) для произвольных — строго сильнее. Разница возникает не из индукции (схема одна и та же в обеих системах), а из схемы свёртывания.
Коммутативность и ассоциативность \(+\), \(\times\) Доказуемы в \(\mathsf{PA}\) индукцией. Без неё (в \(\mathsf{PA}^{\mathrm{rec}}_-\)) существуют нестандартные модели с некоммутативным сложением — как и в арифметике ординалов, где \(\omega{+}1\ne1{+}\omega\).
Конечные множества по Дедекинду B⊊A конечно ⇒ |B|<|A|; станд. конечно ⇔ дед.-конечно Первое — прямое следствие индукции. Направление «станд. конечно ⇒ дед.-конечно» — тоже. Обратное требует счётного выбора \(\mathsf{AC}_\omega\) (лишь следствие, не равносильность); без выбора в \(\mathsf{ZF}\) — недоказуемо (модели Френкеля–Мостовского, первая модель Коэна дают бесконечные дед.-конечные множества).
Теорема Рамсея \(RT^2_2\) конечный случай — «теорема о вечеринке», R(k,m); бесконечный — RT²₂ Конечный случай — индукция по \(k{+}m\). Бесконечный — прямое следствие принципа \(L\); точная сила \(\mathsf{RCA}_0{+}I\Sigma_2\), но сам \(RT^2_2\) не влечёт \(I\Sigma_2\) (Cholak–Jockusch–Slaman, 2001).
Тотальность функции Аккермана не в \(I\Sigma_1\) (теорема Парсонса: \(I\Sigma_1\)-доказуемо-рекурсивные функции = примитивно рекурсивные) → доказуема в \(I\Sigma_2\) — соответствует месту функции Аккермана на уровне \(\omega\) быстрорастущей иерархии.
Теорема Гудстейна (1944) и принцип Пэриса–Харрингтона (1977) истинные \(\Pi_2\)- и комбинаторные предложения языка \(\mathsf{PA}\) не в \(\mathsf{PA}\) (Kirby–Paris, 1982; Paris–Harrington, 1977) — но доказуемы уже трансфинитной индукцией вдоль \(\varepsilon_0\) в \(\mathsf{ATR}_0\). Ординал \(\varepsilon_0\) — доказательно-теоретический ординал \(\mathsf{PA}\) (Генцен, 1936): граница, которую схема \(I\) не может формализовать сама по себе.

Последняя строка отмечает предел мощности локальной/возвратной индукции \(I\iff I^*\): при всей продемонстрированной выше силе, они не замкнуты относительно всех истинных арифметических утверждений. Принцип Пэриса–Харрингтона примечателен ещё и тем, что стал первым примером натуральной (не метаматематической по формулировке) теоремы, чья независимость от \(\mathsf{PA}\) была обнаружена одновременно с самой теоремой.

Список обозначений

\(\mathsf{PA}\)Арифметика Пеано (1-й порядок, полная схема \(I\))
\(\mathsf{Z}_2\)Арифметика второго порядка (анализ)
\(\mathsf{ZFC}\)Теория множеств Цермело–Френкеля с выбором
\(\mathsf{PA}^-\)Дискретное упорядоченное полукольцо без индукции (Kaye)
\(\mathsf{PA}^{\mathrm{rec}}_-\)Арифметика Робинсона в рекурсивной форме + (O1)–(O3), без индукции
S, <, ⩽Последователь; строгий и нестрогий порядок
[0,x)Начальный интервал \(\{y\mid y{<}x\}\)
I, I*Локальная и возвратная индукция
L, DНаименьший элемент; бесконечный спуск
BСхема коллекции
IΣₙ, BΣₙ, IΔ₀Индукция/коллекция ограниченной сложности
RCA₀, WKL₀, ACA₀, ATR₀Подсистемы обратной математики возрастающей силы
ε₀Доказательно-теоретический ординал \(\mathsf{PA}\) (Генцен, 1936)
RT²₂Теорема Рамсея для пар и двух цветов