IS4

úterý 2. července 2024

O víře a důvěře

Stále častěji se na internetu setkávám s videi konfrontujícími ateismus a teismus, víru v Boha (či bohy) a „bezbožnost“. Ať už je to náhoda, znamení či rozmary doporučovacích algoritmů, donutilo mě to zamyslet se nad tím, jak interpretuji víru já jako hluboce racionálně založený člověk a co pro mě znamená v něco věřit.

Další informace »

sobota 13. ledna 2024

O číslech, část 12: Čísla hyperreálná a říše omegy

V minulé epizodě našeho každoročního matematického putování jsme se vydali vstříc nekonečným výšinám ordinálních a kardinálních čísel, spočítali jsme velikost kontinua a našli jsme způsob, jak definovat velikosti jakékoliv množiny jako číslo. Tento pojem zde ale možná používám trošičku ledabyle, protože nově vzniklé objekty jsou čísla asi stejně jako matice, možná i méně – nemůžeme rozumně odčítat ani dělit, což sice obecně nemohou ani přirozená čísla, ale dostupné operace navíc nejsou symetrické (u matic není symetrické jen násobení).

Pojďme si shrnout naše očekávání od každého dobře se chovajícího číselného oboru, která bychom chtěli:

Musí zahrnovat reálná čísla. Přesněji řečeno, reálná čísla musí být izomorfní s nějakou jeho podmnožinou (tedy se musí chovat stejně). Ordinální čísla toto evidentně nesplňují.
Operace se musí chovat předvídatelně, tedy musí být stejně uzavřené, komutativní apod. jako na reálných číslech. Z toho vychází i (bohužel) nemožnost dělení nulou, ale naopak čímkoliv jiným dělit lze (takže duální čísla nebo matice toto nesplňují).
Relace se musí chovat předvídatelně, obdobným způsobem. Daná množina musí být lineárně uspořádaná (takže sbohem komplexním číslům).

Algebraicky řečeno, chceme lineárně uspořádané těleso větší než reálná čísla. Zároveň si z těchto předpokladů můžeme odvodit, co by dále muselo být splněno pro takovou množinu (ačkoliv zatím nevíme, jestli vůbec existuje).

Protože je uspořádaná, každý nový prvek musí být někam zařazen ve vztahu k reálným číslům – buď větší/menší než všechna reálná čísla, nebo v „okolí“ nějakého reálného čísla – třeba větší než nějaké reálné číslo, ale menší než všechna větší reálná čísla (nebo naopak, ale jiné možnosti nejsou vzhledem k tomu, že v reálných číslech nejsou díry). Pro zábavu zkusme následovat napřed druhou variantu.
Pro takové prvky existuje nějaké reálné číslo r, na nějž jsou jakýmsi způsobem vázaná. Když ho odečteme (což můžeme), musíme dostat číslo v „okolí“ nuly. Nekonečně malá čísla tedy existují.
Když existují nekonečně malá čísla, existují i nekonečně velká, když jimi budeme dělit (což musí "nějak" jít).
Všechna čísla můžeme stále libovolně kombinovat za vzniku nových čísel.

Ve výsledku o takové množině jsme schopni tvrdit, že musí obsahovat nekonečně velká čísla i nekonečně malá (navíc je jich nekonečně mnoho), a každé reálné číslo okolo sebe má jakýsi mrak či doménu čísel, která jsou k němu blíž než všechna ostatní reálná čísla.

Přestože to není na první pohled patrné, mít takovou množinu by přineslo obrovský užitek. Každý student matematické analýzy jistě potvrdí, jak zbytečně komplikovaná je práce s limitami, kde se vše musí řešit pomocí oklik přes delty a epsilony, abychom mohli nějak symbolizovat koncept "nekonečného přiblížení". Jak snadné by bylo mít aparát, kde neexistují ony nedefinované hodnoty, na které člověk narazí při operacích nad symbolickými nekonečny +∞ a −∞... ale opravdu nějaký takový existuje?

Najít konkrétní množinu, kde by fungovalo vše zmíněno doposud, se dlouho matematikům nedařilo, a tak nebylo jasné, jestli je vůbec bezpečné s takovýmto objektem pracovat – pokud by neexistoval (a tedy předpoklad jeho existence představuje spor), mohla by práce s ním vést k paradoxům, což matematici tuze rádi nemají (stačí si jenom vzpomenout na problémy, které přináší naivní teorie množin). Navíc, i pokud bychom prokázali jeho existenci, mnoho lidí by ho i tak nepřijalo, pokud bychom ho nedovedli sestrojit (neboli chceme konstruktivní důkaz existence).

Další informace »

pátek 29. prosince 2023

O číslech, část 11: Čísla kardinální a kontinuum

Po tom všem, s čím jsme se setkali v minulém článku, dnešní téma nejspíš až tak ohromující nebude, přesto však, jak již jeho název napovídá, se jedná o mnohem důležitější číselný obor, než jaký představovala čísla ordinální. Ta nám jistým způsobem zobecňovala chování množin vzhledem k jejich (dobrému) uspořádání, ale existuje vlastnost, kterou mají všechny (i neuspořádané) množiny: jejich velikost.

Existuje mnoho způsobů, jak chápat velikost množiny. Jedním z nich je například hustota vzhledem k nějaké posloupnosti (např. přirozených čísel) ‒ jak často prvky posloupnosti můžeme v oné množině najít. Hustota nám dává mnohdy intuitivnější výsledky (třeba sudá a lichá přirozená čísla mají mezi přirozenými čísly hustotu 50 %), ale matematici nejčastěji používají jiný pojem: mohutnost.

Než přejdeme k tomu, jakým způsobem lze mohutnost zjistit, můžeme si napřed zkusit uvědomit, co bychom od ní mohli očekávat. U konečných množin víme, jak by se měly chovat, pokud mají stejnou velikost ‒ můžeme prvky z obou množin spárovat, aniž by nám nějaké zbyly. Praktický důsledek tohoto můžeme vidět třeba v tanečních: pokud je pánů stejné množství jako dam, mohou spolu vytvořit dvojice bez obav, že by se na někoho nedostalo (a též naopak: pokud se všechny podařilo spárovat, musí jich být stejné množství). Odborný název pro spárování prvků dvou množin je bijekce, tedy vzájemně jednoznačné zobrazení. Množiny mají stejnou mohutnost právě tehdy, když mezi nimi existuje (jakákoliv) bijekce. Pokud žádná bijekce není, mohutnost mají nutně jinou.

Konečné množiny se z hlediska mohutnosti chovají tak, jak bychom asi čekali ‒ množina o 3 prvcích má mohutnost 3; množina o 100 prvcích má mohutnost 100. V minulých článcích jsme však již mohli vidět, že nekonečné množiny jsou mnohem složitější. Předně to zpočátku vypadá, že nekonečná mohutnost existuje jen jedna, neboť přirozená, celá, racionální, algebraická i spočitatelná čísla totiž mají všechna stejnou mohutnost (např. proto, že každý program, generující nějaké spočitatelné číslo, lze vyjádřit v nějakém kódování jako přirozené číslo, a tedy jich nemůže být víc).

První nekonečná mohutnost, u které bylo prokázáno, že je větší než mohutnost přirozených čísel, je mohutnost všech reálných čísel neboli mohutnost kontinua: 𝔠. Není potřeba ukazovat proč (Cantorův diagonální důkaz jsem zde již jednou předvedl), ale poznatek, že nekonečna mohou být různě velká, ve své době otřásl celým matematickým věděním. Bylo jasné, že přirozená čísla a jedno nekonečno na popis mohutnosti nestačí a je potřeba vymyslet čísla nová.

Mohutnost množiny se též nazývá kardinalita, tato čísla jsou tedy kardinální (latinsky cardo je pant, přeneseně něco, okolo čeho se vše točí). Je mnoho způsobů, jak je zkonstruovat, nám však bude stačit již oblíbený způsob pomocí třídy ekvivalence ‒ kardinální číslo je třída ekvivalence množin, přičemž dvě množiny jsou pro ni ekvivalentní, pokud mají stejnou mohutnost (tedy pokud mezi nimi existuje bijekce). Je to tedy třída ekvivalence existence bijekce.

Podobně jako u čísel ordinálních jsou mezi kardinálními čísly obsažena všechna přirozená čísla, neboť pro každé z nich lze najít množinu s takovou mohutností (a pokud si vzpomeneme na konstrukci přirozených čísel v minulé kapitole, každé přirozené číslo je samo sobě mohutností). Pokud chceme něco nového, musíme se podívat na nekonečná kardinální čísla.

Jak jsme je definovali, tak je dokážeme najít ‒ stačí identifikovat nějakou nekonečnou množinu. Nejmenší z nich je už známá mohutnost přirozených čísel ℕ, která se jmenuje alef 0 (ℵ₀). Oproti ordinalitě zde máme ještě horší možnosti operací, neboť ℵ₀ + 1 = ℵ₀, tedy přidání nějaké konečné velikosti mohutnost naprosto neovlivní, což se dá dobře ilustrovat třeba na přirozených číslech ‒ pokud z nich odebereme nulu a od každého zbylého čísla odečteme 1, dostaneme zase přirozená čísla, ačkoliv jsme o jedno předtím přišli. Z toho je vidět, že z nekonečna můžeme odebírat libovolné konečné množství prvků, a tím pádem můžeme tolik i přidávat bez účinku na jeho velikost (slavný Hilbertův hotel).

Stejně tak platí ℵ₀ ⋅ ℵ₀ = ℵ₀. Této situaci odpovídá množina všech dvojic přirozených čísel, což jsou například racionální čísla (jako zlomky). Pokud je znázorníme v tabulce, klidně můžeme (postupem dávno ukázaným) projít celou tabulku a všechny prvky tak dát do jedné řady opět o velikosti ℵ₀. Potud žádná zábava.

Abychom dostali nové kardinální číslo, potřebujeme mnohem větší množinu. Klasický způsob, jak dostat spolehlivě větší množinu, je pomocí potenční množiny, neboli množiny všech podmnožin (jako způsob rozmnožení množiny). Potenční množina vytvořená z množiny o velikosti n má velikost 2ⁿ a navíc se dá ukázat, že mezi nimi nikdy neexistuje bijekce, tedy výsledek musí mít vždy větší kardinalitu (i pro nekonečnou). Z potenční množiny množiny o velikosti ℵ₀ nám vzniká nové kardinální číslo 2^ℵ₀, též značené jako ℶ₁ (bet 1), a stejně tak 2^ℶ₁ = ℶ₂ apod. (Poznámka k notaci: Umocnění je zde třeba chápat poněkud metaforicky, ne jako původní operaci, ale spíš jako analogii: kⁿ je počet všech funkcí z n-prvkové množiny do k-prvkové množiny, od toho 2ⁿ pro k = 2; ona dvouprvková množina je zde {ano, ne}, tedy to, co nám přesně identifikuje nějakou podmnožinu podle toho, co v ní je a není. Zatímco výsledná velikost kⁿ je u konečných množin patrná z pozorování, u nekonečných množin ji musíme dodefinovat v opačném směru.)

S číslem ℶ₁ se již dobře známe, neboť přesně takovou mohutnost má třeba množina všech reálných čísel (vyjádřené ve dvojkové soustavě nám každé reálné číslo jako posloupnost číslic identifikuje nějakou podmnožinu přirozených čísel), tedy mohutnost kontinua 𝔠 = ℶ₁ (jak vidno, v této době byla v matematice populární exotická písmena). Zajímavé je také, že 𝔠 ⋅ 𝔠 = 𝔠, tedy celá rovina obsahuje přesně tolik bodů co přímka. Toto zjištění ve své době opět matematiky poněkud zarazilo, ale nakonec bylo přijato a dnes díky němu existují celé křivky schopné vyplnit rovinu.

Další způsob hledání kardinálních čísel vychází z čísel ordinálních ‒ ukázali jsme, že všechna spočetná ordinální čísla větší než ω jsou sama dobře uspořádaná, a tedy jako množina mají ordinalitu ω₁. Navíc je tato množina určitě nespočetná, a její kardinalita se značí ℵ₁. Obdobným způsobem pak existuje i ℵ₂ jako kardinalita všech ordinálních čísel do ω₂ a tak dále.

Doteď jsme nepotřebovali nijak položit základy samotné teorie množin (a stačila nám na to tedy naivní teorie množin, kde množina je definována pouze tím, co obsahuje), ale abychom mohli pokračovat, je potřeba množiny definovat axiomaticky. Jedním z axiomů, který jsem skrytě potřeboval už v předešlé kapitole, je axiom výběru, který nám zaručuje, že pro každý systém neprázdných množin lze vytvořit funkci, která dokáže vybrat z každé množiny právě jeden prvek. Pokud by neplatil, univerzum množin by bylo mnohem chaotičtější ‒ ne každá množina by šla dobře uspořádat (dobré uspořádání vyžaduje stanovení nejmenšího prvku, což bez axiomu výběru nemůžeme u některých systémů množin provést) a ordinální ani kardinální čísla by též nešla uspořádat. Naopak předpokládání axiomu výběrů nám řekne trochu víc o kardinálních číslech ‒ díky němu jsou nekonečná kardinální čísla právě {ℵ₀, ℵ₁, ℵ₂, ...} a nejsou žádná mezi nimi (nebo menší).

V tento moment se, poprvé v této sérii článků, dostáváme k hranici nepoznatelného. Zatímco u všech dosavadních číselných množin bylo poměrně jednoduché je kompletně zmapovat, zde je něco takového nemožné, což zjistíme při snaze zodpovědět jednoduchou a na první pohled základní otázku: čemu se rovná ℶ₁? Vznikly nám tu dvě hierarchie alefů a betů, navíc díky axiomu výběru víme, že každý bet musí být nějaký alef, takže ℶ₁ může být klidně ℵ₁, ale může být i větší. Tímto problémem se zabývá takzvaná hypotéza kontinua, kde ona hypotéza je, že ℵ₁ = ℶ₁ (= 𝔠), tedy že kardinalita kontinua (reálných čísel) je nejmenší ze všech nespočetných kardinálních čísel. Dlouhá desetiletí se matematici snažili tuto hypotézu dokázat nebo vyvrátit, ale až po více než 80 letech se ukázalo, že tato hypotéza je nedokazatelná, nezávislá na ostatních axiomech teorie množin, takže se nejedná o hypotézu, ale o nový axiom ‒ můžeme ji přidat do naší teorie množin a vše bude fungovat, ale můžeme ji i odmítnout a nic se tím nerozbije. To pro nás představuje poněkud zádrhel, neboť zatímco třeba u axiomu výběru nebylo tak obtížné odůvodnit jeho použití (zbaví nás jistých "hypotetických" anomálních množin, které sice mohou existovat, ale stejně je nikdy nedokážeme zkonstruovat), zde stojíme před vcelku nahodilým výběrem, neboť ℶ₁ ve skutečnosti může být libovolně velké kardinální číslo (až na pár výjimek, např. ℵ_ω) a není tedy žádný důvod, proč by to měl být zrovna ℵ₁. Kromě toho existuje ještě zobecněná hypotéza kontinua, která praví ℶ_n = ℵ_n (a je tedy silnější z hlediska implikace).

Tato situace nám opět lehce otřásla naším matematickým sebevědomím, neboť se ukazuje, že i poměrně "jednoduše" formulovatelná otázka může mít odpověď závislou pouze na použitém matematickém aparátu. To v jiných vědách obvykle nechceme, ale v rámci pravdy se s tím zde musíme spokojit ‒ hypotéza kontinua může platit i nemusí a je víceméně na nás, jestli chceme v závislosti na jejím použití mít teorii množin intuitivní, nebo překvapivou. Ve výsledku to je asi stejně jedno, protože množinové světy, které se snažíme takto propojit, nemají samy o sobě moc společného a nějaký nový vztah mezi nimi nám pomůže asi stejně jako přiřazení barev hudebním tónům. Nezbývá tedy než se s tím po vzoru Pointy spokojit s tím, že může platit obojí, a doufat, že už na nic podobného nenarazíme.

Když víme, že kardinálních čísel je nekonečně mnoho, ale nekonečna můžou být různě veliká, kolik jich tedy přesně je? Už víme, že představují posloupnost ℵ₀, ℵ₁, ℵ₂..., a můžeme definovat i ℵ_ω jako sjednocení všech menších kardinálů, dále ℵ_ω+1 jako počet všech ordinalit nad ℵ_ω a tak dále, přes ℵ_{ω_{ω_{ω_{ω_⋱}}}} = ℵ_Φ₁ a ještě výš. Obecně pro libovolné ordinální číslo α vždy existuje ℵ_α, tedy kardinálních čísel musí být (díky bijekci) stejně jako ordinálních. Jak vysoko můžeme jít? Teoreticky jak jen chceme, ale brzo se začnou rozpadat naše vyjadřovací schopnosti pod tíhou velikostí takových čísel. Přestože pro někoho čísla jako ℵ₀ nebo nedejbože ℵ_ω jsou rozhodně velká, pro matematiky jsou stále malinká oproti tomu, co je za nimi. Další zastávkou jsou totiž kardinální čísla nedosažitelná ‒ taková, která se vůbec nedají zkonstruovat pomocí nižších čísel. S prototypem takového čísla jsme se už setkali: ℵ₀. Toto číslo je pochopitelně nedosažitelné operacemi nad přirozenými čísly, a abychom s ním mohli pracovat, potřebujeme ho napřed deklarovat pomocí axiomu nekonečna. Analogicky si můžeme představit mnohem větší čísla, která jsou pro nás nedosažitelná i s pomocí alefů, ale na ty potřebujeme opět přibrat další axiom, neboť dosavadní teorie množin už o nich nic neříká. První takový nedosažitelný kardinál je I₁, ale můžeme jít ještě dál a vybudovat ještě vyšší hierarchie čísel hypernedosažitelných a zcela obrovských (podobně jako u Veblenovy hierarchie).

Již u ordinálních čísel jsme mohli vidět případ, že ordinální čísla se dají definovat sjednocením všech čísel před nimi; můžeme něco takového udělat zde? Co když se podíváme na všechna kardinální čísla? Tím musíme dostat něco zákonitě největší a všeobjímající, co by mělo mít tím pádem největší kardinalitu... nebo ne?

Pokud by množina všech kardinálních čísel sama o sobě měla kardinalitu Ω, musela by tím pádem obsahovat nejen sama sebe (skrz třídu ekvivalence své kardinality), ale i další odvozené kardinality jako 2^Ω apod., ale to nejde ‒ pokud je Ω největší, nemůže existovat nic většího, ale pokud by nebyla největší, nemůže obsahovat všechna kardinální čísla. Vznikl nám paradox.

Zkusme to tedy z pohledu ordinálních čísel: všechna ordinální čísla jsou dobře uspořádaná, takže jako množina mají nějakou ordinalitu Ω. Zároveň ale platí, že každé ordinální číslo je ordinalitou všech menších ordinálních čísel, ale tím pádem by Ω buď nemohlo být ordinální číslo, nebo by platilo Ω < Ω. Opět paradox (Buraliho-Fortiho).

Důvodem toho, proč jsme se dostali do paradoxu, je neúplnost. Každá matematická teorie má své hranice a cokoliv za nimi je pro ni nedosažitelné, a stejně tak žádná matematická teorie nemůže pojmout sama sebe. Aby teorie množin fungovala, nemůže zahrnovat celé svoje univerzum objektů jako jeden z jeho prvků, nemůže existovat množina všech množin, a protože každá množina má svoje kardinální číslo, nemůže existovat ani množina všech kardinálních čísel a tím pádem ani ordinálních. Tato seskupení objektů nejsou množiny z pohledu teorie množin a jakákoliv množina kardinálních nebo ordinálních čísel (ne všech) může být vybudována pouze "zdola nahoru" s využitím dostupných axiomů, ne nějakým libovolným výřezem všech čísel podle nějaké vlastnosti.

Abychom vůbec mohli o takových uskupeních mluvit, používá se pro to termín vlastní třída (každá množina je třída a vše ostatní jsou vlastní třídy). Z pohled teorie množin vlastní třídy neexistují jako samostatné zkoumatelné objekty a můžeme o nich mluvit jen opisně (třeba skrz každou jejich podmnožinu, po vzoru kompaktnosti) nebo pomocí metajazyka (převedením univerzálně kvantifikovaných výroků na univerzálně kvantifikované výrokové schéma). Tímto způsobem ještě můžeme se zachováním znalostí z teorie množin porovnávat vlastní třídy co do mohutnosti (pomocí bijekce), ale už nejde pomocí nich definovat nová kardinální čísla, a pokud se přesuneme do systémů, které dokážou o vlastních třídách mluvit jako o existujících objektech, dokonce bývá zvykem všem vlastním třídám přiřadit stejnou mohutnost: Ω ‒ velikost všeho.

Dorazili jsme na konec, nalezli jsme nekonečno všech nekonečen, kde nic většího už být nemůže. Má potom ještě smysl hledat něco dalšího? Možná ano ‒ sice jsme mohli využit ordinální a kardinální čísla k vystřelení se nehorázně vysoko, ale museli jsme zároveň hodně obětovat: v tomto systému nejsou ani celá celá čísla, sčítání a násobení funguje rozumně jenom pro konečné hodnoty a o odčítání nebo dělení bychom si mohli nechat jenom zdát. Sice jsme se dostali hodně vysoko, možná nejvýše, jak to jen jde, ale přišli jsme o spoustu užitečných vlastností, která činí čísla čísly.

Jde opravdu skloubit čísla s nekonečnem tak, aby vše fungovalo? Na to se podíváme příště.

pondělí 1. srpna 2022

O číslech, část 10: Čísla ordinální a rostoucí hierarchie

Kapitola předchozí nám ukázala, že není zase tak velký nesmysl pracovat s nějakým číslem ω, které je větší než všechna přirozená čísla, a tím by nám vznikla i čísla jako ω + 1 nebo 2ω. To je sice hezké, ale jak bychom takového čísla mohli opravdu dosáhnout z toho, co máme? Musíme se vydat do nekonečna a ještě dál!

Jako tomu bylo už v několika předchozích článcích, i zde se musíme vrátit na samotný začátek našeho matematického putování, k přirozeným číslům. Jich se budeme po zbytek této kapitoly držet, protože koneckonců jenom díky modelům aritmetiky přirozených čísel jsme objevili číslo ω. Tenkrát jsem uváděl množinový způsob konstrukce přirozených čísel, tedy že prázdná množina ∅ = 0; {∅} = 1; {0, 1} = {∅, {∅}} = 2; {0, 1, 2} = {∅, {∅}, {∅, {∅}}} = 3 a tak dále. Můžeme pozorovat, že každé přirozené číslo vlastně identifikujeme s množinou všech menších přirozených čísel, a tak to jde až do nekonečna.

Když víme, že číslo je vlastně množina čísel, proč bychom nemohli postupovat i obráceně, tedy že by množina čísel mohla být číslo? V principu bychom se o něco takového mohli pokusit, ale musíme si stanovit nějaká omezení: předně odebrání čísel z již vytvořeného čísla by nemělo vést k vytvoření něčeho nového, protože to bychom mohli už mezi přirozenými čísly najít hromadu nových množin. Ne, raději zůstaňme u té podoby množin, které jsme viděli doposud, tedy že pokud množina obsahuje nějaké číslo, musí obsahovat i všechna čísla menší.

První nová množina, která toto pravidlo splňuje, je ℕ = {0, 1, 2, 3, 4, …}, všechna přirozená čísla a zároveň sjednocení všech přirozených čísel. Dále bychom mohli jistě najít i ℕ ∪ {ℕ} nebo ℕ ∪ {ℕ, ℕ ∪ {ℕ}} a vlastně úplně stejným způsobem bychom mohli hledat následovníky dalších takových množin. Už minule jsme ukázali, že existence čísla ω nevede sama o sobě k žádným sporům, a nyní už máme i způsob, jak ho zkonstruovat: ω = ℕ. Další čísla se konstruují stejně jako přirozená, tedy ω + 1 = ℕ ∪ {ℕ} atd.

Pokud budeme pracovat s množinou všech přirozených čísel jako s číslem, k čemu by nám takové číslo bylo? Čísla obvykle potřebujeme k popisu nějakých veličin, a v tomto případě to je nejinak ‒ přirozená čísla jsme mohli použít k popisu pořadí; máme-li například ve frontě 5 stojících lidí, můžeme říct, že první z nich stojí na pozici 0, další na pozici 1 atd. Co kdyby ovšem takováhle fronta lidí byla nekonečná? Každému z nich by se dalo přiřadit nějaké přirozené číslo, ale co kdyby přišel další člověk a zařadil se za všechny předchozí? Nebuďme vázáni reálným konečným prostorem a časem; takový hypotetický člověk by, pokud by existoval, musel mít taky pořadí, a to by bylo právě číslo ω (a další za ním by měl ω + 1 atd.). Pořadí je latinsky ordo a proto tato čísla, v tomto kontextu, budeme nazývat ordinální.

Ordinální čísla slouží pro popis množin, které jsou nějakým způsobem uspořádané. Podobně jako onu frontu lidí bychom chtěli popsat stejným způsobem i frontu stromů, cihel, hvězd nebo čísel; chceme tedy sdružit všechny množiny (přesněji množiny vybavené nějakým pořadím) podle nějaké ekvivalence, jako jsme to už dříve dělali. Pro tuto konkrétní ekvivalenci potřebujeme izomorfismus vzhledem k pořadí, tedy můžeme nahradit všechny prvky množiny za jiné a změnit způsob, jakým je uspořádáme, ale jejich vzájemné pořadí se tím nijak nezmění. Tak například všechna přirozená čísla a všechna sudá přirozená čísla jsou takto ekvivalentní, neboť vynásobení nebo vydělení 2 nijak neovlivní jejich pořadí. Stejně tak libovolný interval reálných čísel je ekvivalentní s jakýmkoliv jiným intervalem reálných čísel, pokud jsou oba stejného typu, i pokud zaměníme ≤ za ≥ (můžeme prohodit konce intervalů). Jelikož se jedná o izomorfismus, je jasné, že mezi danými množinami musí existovat bijekce, tedy musí být stejně velké.

Takto ekvivalentní množiny mají společné něco, čemu budu říkat ordinalita (anglicky order type, typ pořadí). Množiny se stejnou ordinalitou náleží do společné třídy ekvivalence, takže samotnou třídu ekvivalence dané množiny bych mohl chápat jako její ordinalitu, ale možná by bylo dobré snažit se najít nějakého dobrého reprezentanta takové třídy ekvivalence, tedy nějakou prototypální množinu se stejnou ordinalitou.

Každé ordinální číslo je uspořádané a ve skutečnosti tento typ uspořádání má speciální název: dobré uspořádání. Dobře uspořádaná množina je lineárně uspořádaná (podobně jako např. celá, racionální nebo reálná čísla), ale zároveň má jednu důležitou vlastnost: každá neprázdná podmnožina takové množiny má nejmenší prvek. To evidentně nesplňují už celá čísla (záporná čísla nemají minimum) a tím pádem ani racionální nebo reálná čísla, i kdybychom je zdola omezili (zdola otevřené intervaly taky nemají minimum). Přestože i u těchto množin dává smysl hovořit o ordinalitě, nadále se omezíme pouze na dobře uspořádané množiny.

Každé ordinální číslo je jako množina dobře uspořádané, protože každé ordinální číslo má konečné množství přímých předchůdců (žádné, pokud se jedná o limitní ordinál jako ω nebo ω + ω). Jedná se tedy o jakési rozšíření přirozených čísel, pokud bychom chtěli zachovat jejich dobré uspořádání. Ve skutečnosti každá dobře uspořádaná množina je ekvivalentní s nějakým ordinálním číslem, takže je můžeme chápat jako ony reprezentanty či prototypy dané ordinality.

Protože ordinální čísla reprezentují pořadí, operace nad nimi jsou definovány trochu jinak, než jak jsme zvyklí: nejsou komutativní. Zde záleží na pořadí, neboť ω + 1 a 1 + ω jsou z hlediska pořadí množin odlišné věci ‒ to první je fronta o délce (ordinalitě) ω, za níž je dán další prvek, zatímco to druhé je jeden prvek, za nějž je dána fronta o délce ω; je jasné že 1 + ω je vlastně pouze ω, protože v tom nekonečnu dalších přidaných prvků se ten první lehce ztratí. Podobně i ω + ω = 2ω, ale ω⋅2 = ω, protože ordinalita nekonečné řady dvojic je zase jen ω. (Zde je moje notace opačná vůči obecně používané notaci, kdy 2⋅ω = ω. To mi nepřijde přirozené, protože 2ω chápu jako dvě omegy a ω⋅2 chápu jako omegu dvojic. Mám právo si to definovat jinak, ale buďte opatrní, pokud to budete chtít někde takto používat.) Odčítání a dělení ordinálních čísel raději vůbec dělat nebudeme.

To je všechno hezké, ale kolik takových čísel vlastně je, a jak se k nim můžeme dostat? Jeden můj oblíbený způsob, jak nacházet stále větší a větší ordinální čísla, je pomocí rychle rostoucí hierarchie. Smyslem tvorby této hierarchie je ukázat užitečnost ordinálních čísel při hledání velmi velkých přirozených čísel, a to díky diagonalizaci.

Mějme nekonečnou tabulku čísel:

	f_k(0)	f_k(1)	f_k(2)	f_k(3)	f_k(4)	f_k(5)	f_k(6)	f_k(7)	f_k(8)	f_k(9)	⋯
f₀(x)	1	2	3	4	5	6	7	8	9	10	⋯
f₁(x)	2	3	4	5	6	7	8	9	10	11	⋯
f₂(x)	3	4	5	6	7	8	9	10	11	12	⋯
f₃(x)	4	5	6	7	8	9	10	11	12	13	⋯
f₄(x)	5	6	7	8	9	10	11	12	13	14	⋯
f₅(x)	6	7	8	9	10	11	12	13	14	15	⋯
f₆(x)	7	8	9	10	11	12	13	14	15	16	⋯
f₇(x)	8	9	10	11	12	13	14	15	16	17	⋯
f₈(x)	9	10	11	12	13	14	15	16	17	18	⋯
f₉(x)	10	11	12	13	14	15	16	17	18	19	⋯
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋱

Každý řádek této tabulky představuje jednu funkci f_k(x). Je vcelku jedno, jak je tato funkce definována, ale je patrné, že každá následující funkce je větší než všechny funkce před ní. (Normálně u takových hierarchií bývá zvykem zvolit f_k(x) tak, aby rostla trochu strměji, ale to tady nepotřebujeme; asi by bylo lepší říct, že máme jen rostoucí hierarchii, ovšem nikoliv rychle.)

Existuje nějaká funkce, která roste víc než jakákoliv f_k(x) v této tabulce? Ano; pokud bychom vzali kupříkladu čísla na diagonále (1, 3, 5, 7, 9, 11 atd.), evidentně rostou rychleji (o 2) než čísla na jakémkoliv řádku této tabulky. V takovém případě by možná mělo smysl tato čísla identifikovat taky, a to právě pomocí notace f_ω(x):

	f_ω+k(0)	f_ω+k(1)	f_ω+k(2)	f_ω+k(3)	f_ω+k(4)	f_ω+k(5)	f_ω+k(6)	f_ω+k(7)	f_ω+k(8)	f_ω+k(9)	⋯
f_ω(x)	1	3	5	7	9	11	13	15	17	19	⋯
f_ω+1(x)	2	4	6	8	10	12	14	16	18	20	⋯
f_ω+2(x)	3	5	7	9	11	13	15	17	19	21	⋯
f_ω+3(x)	4	6	8	10	12	14	16	18	20	22	⋯
f_ω+4(x)	5	7	9	11	13	15	17	19	21	23	⋯
f_ω+5(x)	6	8	10	12	14	16	18	20	22	24	⋯
f_ω+6(x)	7	9	11	13	15	17	19	21	23	25	⋯
f_ω+7(x)	8	10	12	14	16	18	20	22	24	26	⋯
f_ω+8(x)	9	11	13	15	17	19	21	23	25	27	⋯
f_ω+9(x)	10	12	14	16	18	20	22	24	26	28	⋯
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋱

Z určitého hlediska je funkce f_ω(x) "za všemi" předchozími funkcemi, protože odpovídající prvky jsou eventuálně větší než prvky jakékoliv dosavadní funkce. Stejně tak dává smysl mít f_ω+1(x) pro funkci odpovídající diagonále posunuté o 1 dolů, a tak podobně. Nic nám nyní nebrání identifikovat i diagonálu v této tabulce jako f_ω+_ω(x):

	f_2ω+k(0)	f_2ω+k(1)	f_2ω+k(2)	f_2ω+k(3)	f_2ω+k(4)	f_2ω+k(5)	f_2ω+k(6)	f_2ω+k(7)	f_2ω+k(8)	f_2ω+k(9)	⋯
f_2ω(x)	1	4	7	10	13	16	19	22	25	28	⋯
f_2ω+1(x)	2	5	8	11	14	17	20	23	26	29	⋯
f_2ω+2(x)	3	6	9	12	15	18	21	24	27	30	⋯
f_2ω+3(x)	4	7	10	13	16	19	22	25	28	31	⋯
f_2ω+4(x)	5	8	11	14	17	20	23	26	29	32	⋯
f_2ω+5(x)	6	9	12	15	18	21	24	27	30	33	⋯
f_2ω+6(x)	7	10	13	16	19	22	25	28	31	34	⋯
f_2ω+7(x)	8	11	14	17	20	23	26	29	32	35	⋯
f_2ω+8(x)	9	12	15	18	21	24	27	30	33	36	⋯
f_2ω+9(x)	10	13	16	19	22	25	28	31	34	37	⋯
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋱

Smyslem všech těchto tabulek bylo ilustrovat jediné: i když jsme museli najít ordinální čísla až za nekonečnem, díky jejich schopnosti zachytit ordinalitu množin se dají použít v něčem, co je naprosto smysluplné ‒ pokud bychom všechny tyto funkce chtěli seřadit podle toho, jak moc rostou (chceme, aby od určitého místa byly prvky jedné funkce vždy větší než prvky jiné funkce), diagonálně sestrojená funkce je vždy v pořadí větší než všechny řádkové funkce a ordinalita množiny všech funkcí až do f_k(x) je přesně k.

Pokud bychom v diagonalizaci postupovali dále, dostávali bychom funkce f_3ω+k(x), f_4ω+k(x), f_5ω+k(x), f_6ω+k(x) a obecně f_(n+1)ω+k(x) = f_nω+x+k(x). Co ale potom? Dokázali bychom tady najít nějakou funkci, která by se v této posloupnosti nenacházela, ale stále by byla větší než všechny předchozí?

Mohli bychom zkusit diagonalizovat samotnou diagonalizaci, s rostoucím x brát výsledky z dalších a dalších diagonalizací. To by byla funkce g(x) = f_xω(x) a je jen přirozené pro její identifikaci použít číslo ω⋅ω = ω², tedy f_ω²+k(x) = f_xω+k(x):

	f_ω²+k(0)	f_ω²+k(1)	f_ω²+k(2)	f_ω²+k(3)	f_ω²+k(4)	f_ω²+k(5)	f_ω²+k(6)	f_ω²+k(7)	f_ω²+k(8)	f_ω²+k(9)	⋯
f_ω²(x)	1	4	9	16	25	36	49	64	81	100	⋯
f_ω²+1(x)	2	5	10	17	26	37	50	65	82	101	⋯
f_ω²+2(x)	3	6	11	18	27	38	51	66	83	102	⋯
f_ω²+3(x)	4	7	12	19	28	39	52	67	84	103	⋯
f_ω²+4(x)	5	8	13	20	29	40	53	68	85	104	⋯
f_ω²+5(x)	6	9	14	21	30	41	54	69	86	105	⋯
f_ω²+6(x)	7	10	15	22	31	42	55	70	87	106	⋯
f_ω²+7(x)	8	11	16	23	32	43	56	71	88	107	⋯
f_ω²+8(x)	9	12	17	24	33	44	57	72	89	108	⋯
f_ω²+9(x)	10	13	18	25	34	45	58	73	90	109	⋯
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋱

Zatímco předchozí růst byl lineární, tento je už kvadratický, takže je vidět, že výsledek opravdu roste mnohem rychleji a tato funkce tedy musí být v pořadí za všemi předchozími. I tuto funkci můžeme diagonalizovat a dostaneme f_ω²+ω(x), f_ω²+2ω(x), f_ω²+3ω(x) a opětovnou diagonalizací diagonalizace f_ω²+ω²(x).

Diagonalizací ovšem stále ještě není dost, opět můžeme provést diagonalizaci diagonalizací, a tak dostaneme f_ω³(x), tentokráte s kubickým růstem. Nu a když celé toto opět diagonalizujeme, dostaneme f_ω^ω(x) s růstem jako x^x. Z určitého hlediska si každé takové ordinální číslo můžeme představit i jako výraz, kde místo ω bude x, a takový výraz bude charakteristickou funkcí daného ordinálního čísla, izomorfní vzhledem k pořadí.

Celý tento proces se dá znázornit jedním obrázkem:

Tato spirála končí ve ω^ω, ale nic nám nebrání jít ještě dál. Jako další dostaneme ω^{ω^ω}, potom ω^{ω^{ω^ω}} a na cestě směrem do ω^{ω^{ω^{ω^⋰}}} nám překáží už jenom naše notace. Místo ω^ω však můžeme použít Knuthův zápis ω ↑↑ 2 a jít tak ještě dále, až do ω ↑↑ ω.

Kdybychom neměli k dispozici novou notaci, k ω ↑↑ ω se můžeme dostat i jiným způsobem, podobným tomu, jak jsme sestrojili ω, jako sjednocení všech přirozených čísel. Stejným způsobem můžeme sjednotit i všechna ordinální čísla ω ↑↑ n a tím získáme dobře uspořádanou množinu, jejíž ordinalita je právě ω ↑↑ ω. Toto číslo se též značí ϵ₀ a ještě jedna možnost, jak si ho představit, je jako nejmenší pevný bod splňující rovnost x = ω^x, tedy platí ϵ₀ = ω^ϵ₀.

Dosáhli jsme konce našich možností? Stále ne, neboť i za ϵ₀ jsou vyšší ordinální čísla, začněme třeba u ϵ₀ + 1, ω^{ϵ₀ + 1}, ω^{ω^{ϵ₀ + 1}} a tak dále. Celá tato posloupnost má opět "limitu", tentokráte ϵ₁ = ϵ₀^{ϵ₀^{ϵ₀^{ϵ₀^⋰}}}, další ordinální číslo jako pevný bod x ↦ ϵ₀^x. Už není asi moc překvapivé, že i x ↦ ϵ₁^x má pevný bod ϵ₂ a tímto způsobem můžeme jít opět až do nekonečna, kde nalezneme ϵ_ω a po něm ϵ_{ϵ_ω}, ϵ_{ϵ_{ϵ_ω}} a opět dále až do ϵ_{ϵ_{ϵ_{ϵ_⋱}}} = ζ₀ jako řešení x = ϵ_x. Situace se zde zase opakuje, dostáváme totiž ζ₁ = ζ₀^{ζ₀^{ζ₀^{ζ₀^⋰}}} a opět ζ_{ζ_{ζ_{ζ_⋱}}} = η₀.

Zdá se, že nám pomalu dochází řecká abeceda, ale chybějící notace nesmí být pro matematika překážkou! Stačí použít Veblenovu hierarchii, která nám dá alternativní označení všech dosavadních čísel: ϕ₀(x) = ω^x, ϕ₁(x) = ϵ_x, ϕ₂(x) = ζ_x a ϕ₃(x) = η_x. Jednoduše řečeno dolní index u ϕ nám vybírá "písmenko" a argument této funkce nám vybírá dolní index toho písmenka (až na ϕ₀). Pro další účely budu ϕ_k(0) zkracovat prostě jako ϕ_k.

Ani s Veblenovou funkcí jsme se stále na konec nedostali, protože i tato hierarchie tvoří dobře uspořádanou množinu a její ordinalita je řešením x = ϕ_x, tedy ϕ_{ϕ_{ϕ_{ϕ_⋱}}} = Γ₀. Toto číslo se nazývá Fefermanův–Schütteho ordinál a ohraničuje všechny ordinály, ke kterým se dá dostat diagonalizací a rekurzí. Od tohoto momentu se už pohybujeme v oblasti tak velkých čísel, že nám dochází nejenom notace, ale vyjadřovací síla mnohých existujících matematických teorií. Přesto však můžeme pokračovat dále, neboť tak jako Γ₀ ohraničuje všechna ordinální čísla dosažitelná pomocí Veblenovy funkce z předchozích čísel, tak i Γ₁ ohraničuje všechna další dosažitelná ordinální čísla, která obsahují Γ₀.

Sice jsme ztratili schopnost konstrukce takových čísel, ale pořád můžeme jít dál; po Γ₁ dostáváme Γ₂, potom Γ₃ a nakonec samozřejmé i Γ_{Γ_{Γ_{Γ_⋱}}}. Přestože hovoříme o astronomicky velkých číslech, za Fefermanovým–Schütteho ordinálem už není moc velká možnost invence; všechno budou jen ohraničení nějak dosažitelných ordinálních čísel. I Veblenovu funkci můžeme dále rozšiřovat o další argumenty, ovšem se stejným výsledkem.

Pokud bychom chtěli prorazit teoretickou hranici těchto ordinálů, potřebujeme různé triky. Nejčastěji se do hry přibere nehorázně velké ordinální číslo Ω, takové, které jsme doposud ještě nenavštívili, a které je větší než cokoliv, co bychom mohli tímto způsobem vytvořit. Taková existují taky, ale ještě jsme příklad žádného z nich neviděli, takže tuto cestu dále následovat nebudeme.

Všechna dosavadní čísla byla spočitatelná (tedy existuje algoritmus, který dokáže posoudit, jestli nějaká množina má takovou ordinalitu), takže je můžeme ohraničit nejmenším nespočitatelným ordinálem, což je Churchův–Kleeneho ordinál ω₁^CK, opět další významný hraniční ordinál z různých teorií. Po něm následují i další ordinály, různě ohraničují větší a větší množiny ordinálních čísel, ale už tak zajímavé nejsou, a v principu můžeme přijít na další množiny ordinálních čísel, za nimiž vždy musí být ordinál, který v nich není.

Sice to vypadá, že jsme dosáhli již astronomických výšek, přesto jsme se však téměř vůbec nepřiblížili ničemu, co tvoří většinu celého prostoru ordinálních čísel. Zůstali jsme totiž jen u spočetných ordinálních čísel, to znamená, že každé určuje jen nějaké uspořádání spočetné množiny, tedy například přirozených čísel. Znamená to taky, že jakákoliv množina se sebevyšší ordinalitou, i tak vysokou jako ω₁^CK, má stále stejný počet prvků jako přirozená čísla. Sice se nám tedy povedlo přirozená čísla "roztáhnout" do pyramidálních výšin stále složitějšími uspořádáními, ale zatím jsme vlastně na skutečně větší množinu nenarazili. Zatímco přirozená čísla charakterizovala jak pořadí, tak velikost, zde zatím zůstalo jen u pořadí.

To se ovšem změní ‒ všechna spočetná ordinální čísla, tedy taková, která jsme zatím viděli, i všechna další, která mohou uspořádat přirozená čísla, sama tvoří množinu. Tato množina je dobře uspořádaná, ale musí být větší než všechny předchozí, nejenom vyšší jako ordinální číslo, ale i mohutnější jako množina (protože jinak by musela obsahovat sama sebe, což nejde). Jedná se o první nespočetné ordinální číslo, ω₁ (občas též značeno Ω; lze jej též použít v procesu výše pro nacházení dalších vysokých spočetných ordinálů), a takovou ordinalitu může mít pouze a jedině množina větší než přirozená čísla.

Podobným způsobem můžeme definovat i ω₂ jako ordinalitu všech ordinálních čísel uspořádávajících množiny o stejné velikosti, jako má ω₁, a asi už není překvapivé, že nakonec dostaneme i ω_ω, ω_{ω_ω} a dorazíme k dalšímu limitnímu ordinálu ω_{ω_{ω_{ω_⋱}}} = Φ₁. Jak patrno, to, co jest nahoře, jest jako to, co jest dole.

Hledat čísla větší než Φ₁ má samozřejmě smysl, ale v tento moment už není potřeba vázat se tolik na pořadí. Existence čísel ω₁, ω₂ atd. nám ukázala, že můžeme tvořit tak mohutné množiny ordinálních čísel, jak jen chceme, ale co vlastně znamená mohutnost množiny, či její spočetnost, a jak daleko se takto můžeme dostat? Na to vše se podíváme někdy příště.

Jako poslední věc se opět musím zamyslet, jak by vypadala ordinální čísla v našem matematickém světě. Inu, jelikož byla vytvořena jako rozšíření přirozených čísel, musí se nacházet na samém vrcholu naší nekonečné věže, a ještě výše. Je to vůbec možné? Samozřejmě:

úterý 30. listopadu 2021

O číslech, část 9: Nestandardní modely aritmetiky

Ačkoliv se nám stále daří nacházet další a další číselné obory, vše se zatím točilo okolo čísel reálných, potažmo komplexních – nacházeli jsme vícerozměná čísla, která nějakým způsobem protínala náš doposud známý svět, a když jsme se na něj podívali zcela jiným způsobem, našli jsme nekonečná, a přesto jistým způsobem cyklická čísla p-adická.

Všechno začalo u čísel racionálních, ale pojďme se na chvíli vrátit na samotný začátek, teď, když už jsme poznamenáni logikou a jsme připraveni čelit věcem, které mohou být trochu divné. V první kapitole jsem definoval přirozená čísla pomocí množin či funkcí, abychom věděli, s čím vlastně zacházíme. To je takzvaný konstruktivistický přístup, tedy že každý matematický objekt musíme napřed sestrojit, abychom s ním mohli pracovat, ale většině matematiků stačí teoreticky dokázat, že takový objekt musí existovat, a především v oblasti matematické logiky je takových objektů habaděj.

Můžeme přirozená čísla definovat, aniž bychom se vázali na nějaké konkrétní objekty? Ano, pomocí něčeho, čemu logika říká teorie. Teorie se váže k nějakému univerzu objektů a pomocí axiomů popisuje, jak se takové objekty mají chovat vůči nějakým operacím. Narozdíl od fyzikálních teorií nepotřebujeme, aby dokázala nějak rozumně popisovat a předvídat realitu; stačí nám pouze konzistentnost, aby se z daných axiomů nedokázal vyvodit spor. Pokud nalezneme nějaké univerzum objektů, určíme, co v něm znamenají použité operace, a prokážeme, že v něm platí dané axiomy, získáme tím model dané teorie. Všechny modely dané teorie jsou z určitého pohledu ekvivalentní a platí v nich totéž, co se dá vyvodit z jejích axiomů.

Přirozená čísla popisují tzv. Peanovy axiomy:

Existuje 0 (počátek).
Rovnost je reflexivní.
Rovnost je symetrická.
Rovnost je tranzitivní.
Rovnost je uzavřená (přirozené číslo je rovno pouze jinému přirozenému číslu).
Následovník čísla vždy existuje.
Pokud je následovník dvou čísel stejný, jedná se o stejná čísla.
0 není následovník žádného čísla.
Platí matematická indukce.

Tyto axiomy byly samozřejmě definovány přesněji, než jak jsem je zde zapsal, ale vystihují podstatu přirozených čísel dokonale: neexistují žádné "nestandardní" modely takovéto teorie, jež by popíraly naši intuici (například očekáváme, že dva takové modely musí mít vždy stejnou velikost). Zachraňuje to totiž 9. axiom, a to proto, že vyžaduje logiku 2. řádu (logika 1. řádu povoluje kvantifikování pouze přes jednotlivé prvky daného univerza, zatímco logika 2. řádu povoluje kvantifikovat i přes množiny).

Pomocí jistého triku můžeme 9. axiom převést na nekonečnou množinu jednotlivých axiomů, které odpovídají určitému schématu, pro každou větu z logiky 1. řádu, aby indukce pořád platila, a získáme tak Peanovu aritmetiku 1. řádu. Jelikož se však omezujeme ve svých možnostech indukce jen na logiku 1. řádu, nedokážeme tím přesně podchytit původní modely; získáváme jich mnohem víc.

Nestandardní modely aritmetiky jsou přesně ty modely Peanovy aritmetiky 1. řádu, které nejsou modely oné teorie v logice 2. řádu. Když jsme nahlíželi na přirozená čísla jako na nekonečný řetěz s jediným koncem, můžeme si představit, jak by asi vypadaly takové nestandardní modely: v každém musí být obsažen onen původní řetěz, ale navíc tam mohou být i další řetězy, nekonečné s jedním nebo žádným koncem (a pokud bychom odstranili axiom o indukci úplně, i cyklické konečné).

Tak třeba může existovat číselný systém, kde kromě 0 existuje i nějaké číslo ω, které je zdola nedosažitelné – není následovníkem jiného čísla. Takové číslo musí být větší než všechna klasická přirozená čísla (to lze vyvodit z axiomů) a stejně tak musí existovat i ještě větší čísla jako ω + 1 nebo 2ω = ω + ω, které tím pádem taky musí být nedosažitelné.

Takových systémů existuje nepřeberné množství, dokonce pro libovolnou velikost číselné množiny se dá vždy nějaký najít. Někdy však není na škodu se přiklonit ke konstruktivismu, minimálně při psaní článků o matematice, a proto by bylo dobré se snažit najít konkrétní způsoby, jak se k takovým číslům dostat, a nespokojit se jen s popisem, jak vypadají nebo co s nimi lze dělat. Zatím pro nás tedy taková čísla zůstávají jen hvězdami na obloze, u kterých nevíme, jak jsou daleko, ani z čeho jsou.

Na nějakou chvíli tak některé naše otázky zůstanou ještě nezodpovězeny, ale konečně jsme se dostali k jednomu konceptu, který na nás čekal už od začátku: k nekonečnu. Zatím jsme mluvili pouze o nekonečných množinách, ale nyní vidíme odraz nekonečna v objektu, který s množinami nesouvisí. Ono číslo ω je větší než jakékoliv standardní přirozené číslo, a tedy o něm můžeme mluvit jako o nekonečně velkém čísle, ovšem není zdaleka jediné.

V příští kapitole se podíváme na další způsoby, jak dosáhnout nekonečna.

středa 13. října 2021

O číslech, část 8: Čísla 𝑝-adická

Běžně používaná čísla v matematice jsou dnes dvojí: reálná čísla a komplexní čísla. Reálná čísla byla zatím určitým maximem, ke kterému jsme se dostávali, aniž bychom přicházeli o užitečné vlasnosti, zatímco o úroveň vyšší komplexní čísla nám sice umožňují vyjádřit odmocninu z −1, ale ztrácí vlastnost lineární uspořádanosti. V rovině už prostě nemáme možnost hovořit smysluplně o nějakém univerzálním pořadí, které by mělo stejné vlastnosti jako pořadí na číselné ose.

Komplexní čísla jsou jistým milníkem v našem putování, který odděluje běžné číselné množiny od těch exotických. Neznamená to, že vše následující je jen nepraktickou kuriozitou, naopak, ale nesmíme být překvapeni, pokud narazíme na něco, co je v rozporu s naším chápáním reality.

V tomto článku se napřed musíme vrátit téměř na samotný počátek našeho matematického putování, ještě do dob, kdy naše cesta byla přímočará a rozhodnutí jasná. Bylo tomu ale opravdu tak? Pojďme si (opět) rekapitulovat, jak vznikla reálná čísla:

Pro účely reprezentace počtu či pořadí jsme pomocí operace následovníka vytvořili přirozená čísla a nad nimi operace sčítání a násobení.
Po seznání, že sčítání v některých případech není invertibilní, jsme vytvořili celá čísla jako dvojice charakterizující rozdíl.
Násobení stále ještě též invertibilní nebylo, takže jsme analogicky vytvořili racionální čísla.
Pozorovali jsme, že některé množiny racionálních čísel mají „okraj“, který není sám racionální, a doplněním vznikla reálná čísla.

Mohli jsme na této cestě někde odbočit a dojít k něčemu jinému? Těžko si lze představit, že by existoval nějaký jiný způsob, jak vytvořit přirozená čísla, a další dvě následující číselné množiny taky nejsou ničím parametrizované, co však reálná čísla?

K reálným číslům se dá dojít mnoha způsoby, v závislosti na tom, na co se zaměřujeme. Z pohledu notace si můžeme reálné číslo představit jako nekonečný součet číslicových násobků stále se zmenšujících mocnin deseti a i to je validní definice. Původně jsme je definovali jako ohraničení (suprema) množin reálných čísel, což je v principu zaměřeno na porovnávání. V obou případech však je cílem najít číslo, ke kterému se mohla již známá čísla blížit, ačkoliv nové číslo mezi nimi neexistovalo. Jak ale něco takového můžeme formalizovat?

V matematice je přibližování charakterizováno pojmem limita. Zjednodušeně je limita něco, k čemu se posloupnost (nebo funkce) blíží v okolí nějakého bodu. Tím může být třeba i nekonečno a znamená to, že ať si budeme přát jakékoliv přiblížení k žádané hodnotě, stačí přeskočit jen konečné množství prvků posloupnosti, než se k ní dostaneme na dané přiblížení. Je to vlastně forma boje: protivník nám zadá vzdálenost, kterou chce, a my musíme najít index v posloupnosti, od kterého dál se to k oné hodnotě bude vždy blížit. Pokud takový index existuje, je daná hodnota limitou.

V celé množině racionálních čísel můžeme najít spousty posloupností, které mají (konečnou) limitu, která ale není racionální, a právě tyto posloupnosti nám umožní definovat reálná čísla (stačí se podívat na příklad s notací, i částečné součty – desetinné aproximace reálného čísla – se k němu takto blíží). Je zde ale „malý“ problém: jak použít tento přístup k definici reálných čísel, když už musí existovat, abychom mohli vyjádřit přiblížení k nějakému takovému číslu? To by byla definice kruhem; nemůžeme pomocí reálných čísel definovat reálná čísla.

Záchranu pro nás představují cauchyovské posloupnosti. Zatímco konvergence posloupností (tedy otázka, zdali mají limitu) potřebovala tu limitu znát předem, definice cauchyovské posloupnosti to nepotřebuje – postačující kritérium je, aby se k sobě od určitého místa libovolně blížily samotné prvky té posloupnosti navzájem. Protivník nám tedy nyní dá jen vzdálenost (a už ne testovanou limitu) a my hledáme místo, kde můžeme odříznout novou posloupnost, kde libovolné dva prvky budou od sebe vzdálené nejvýše tak, jak nám bylo zadáno.

Pro reálná čísla konvergentní a cauchyovské posloupnosti splývají, ale racionální čísla mají mnoho cauchyovských posloupností, které se k žádnému racionálnímu číslu neblíží (nýbrž k iracionálnímu). Teď už je to pro nás jednoduché – stačí každé reálné číslo identifikovat pomocí cauchyovské posloupnosti (vytvoříme takzvanou cauchyovsky úplnou množinu). Musíme být jen trochu opatrní, protože mohou existovat různé posloupnosti, které se blíží ke stejnému iracionálnímu číslu, takže ve skutečnosti každé reálné číslo je celá třída ekvivalence cauchyovských posloupností, jejichž rozdíl má nulovou limitu (to je ta ekvivalence). Reálné číslo je tedy zase množina.

Tak se nám podařilo opět definovat reálná čísla, ale mohli jsme si v tomto případě někde vybrat?

Zacházeli jsme intuitivně s pojmem vzdálenost. Co je vzdálenost? V našem pojetí to byla tzv. eukleidovská metrika, tedy v případě racionálních čísel prostá absolutní hodnota jejich rozdílu. Je to ale jediná možnost?

I metrika musí splňovat nějakou definici, abychom ji tak mohli chápat. Metrika (na nějaké množině) musí splňovat toto:

Nulová metrika dvou bodů znamená, že to jsou tytéž body, a naopak.
Metrika je symetrická (z jednoho bodu do druhého to je stejně daleko jako v opačném směru).
Platí trojúhelníková nerovnost (přímá cesta mezi dvěma body je ta nejkratší, cesta přes třetí bod nemůže být kratší).

S těmito vlastnostmi vzniká metrický prostor a jen v takovém případě dává smysl hledat limity a cauchyovské posloupnosti. Kromě klasické metriky si můžeme vymyslet spoustu dalších, třeba součet nebo maximum absolutních hodnot. Mnoho z nich by taky vedlo k reálným číslům.

A pak je tu p-adická metrika, kde p je libovolné prvočíslo. S ní vznikne něco, co popírá intuici. Cesta k ní je trochu komplikovaná, ale není tak těžké ji pochopit:

Porovnávaná čísla od sebe odečteme, výsledek nazvěme x.
Porovnáváme jen racionální čísla, takže i x je racionální a vyjádřitelné jako zlomek v základním tvaru (kde čitatel i jmenovatel jsou nesoudělná čísla).
Pokud je čitatel dělitelný p, celý zlomek vydělíme p. Pokud je dělitelný jmenovatel, celý zlomek násobíme p. Nemůže nastat obojí, protože pak by to nebyl zlomek v základním tvaru.
Krok výše opakujeme, dokud to jde, tedy jednoduše dělíme čitatel nebo jmenovatel p do úplného vydělení.
Tímto způsobem získáme vyjádření x = p^k ⋅ a/b. Celé číslo k představuje jakýsi řád zlomku vzhledem k p. Jeho absolutní hondota představuje množství kroků, které jsme museli učinit, než neměl daný zlomek nic společného s p, a znaménko představuje tu část zlomku, kterou jsme redukovali (kladné v případě čitatele, záporné v případě jmenovatele). Číslo k vždy existuje a je jednoznačné; zbytek a/b nás už nadále nezajímá.
Výsledná metrika je p^−k.

Ještě je nutno dodat, že pokud je x rovno nule (a porovnáváme tedy stejná čísla), takto definovaná metrika by byla 1, což podle pravidel nejde, takže nulu musíme stanovit jako výjimku v tomto postupu, abychom splnili první pravidlo. Druhé pravidlo metriky platí též, protože mocninu p z nějakého zlomku vytáhneme bez ohledu na jeho znaménko. Trojúhelníková nerovnost platí taky, dokonce ještě v silnější formě: cesta přes jiný bod bude z jednoho směru vždy delší už v momentě, kdy se dostaneme do toho bodu.

Ve skutečnosti by toto celé nebylo tak zajímavé, nebýt kroku 6 a především znaménka v daném vzorci. Jak se takováto vzdálenost tedy chová?

Dvě stejná čísla mají vzdálenost 0 (jinak to ani nejde).
Pokud se dvě čísla liší o něco, co není vyjádřitelné mocninou p vzhledem k postupu výše, jejich vzdálenost je 1.
Pokud se dvě čísla liší o nějaký nízký celočíselný násobek p (menší než p), jejich vzdálenost je 1/p.
Pokud se dvě čísla liší o násobek p², jejich vzdálenost je 1/p².

A zde je ten zvláštní jev: rozdíly ve stále větších mocninách p jsou z pohledu p-adické metriky stále menší a menší. Pro p = 2 tak třeba čísla 2, 4, 8, 16, 32 atd. jsou stále blíže nule, přestože by se taková posloupnost za normálních okolností ničemu neblížila, a naopak jejich převrácené hodnoty se od nuly neustále vzdalují, opět v rozporu s eukleidovskou metrikou.

Triadická čísla (p = 3). Zmenšující se kružnice obklopují k sobě triadicky bližší a bližší čísla.

Není však potřeba předbíhat – máme p-adickou metriku, máme racionální čísla a jejich cauchyovským doplněním vzniknou p-adická čísla ℚ_p, skládající ze z cauchyovských posloupností racionálních čísel vzhledem k dané metrice. Ačkoliv to vypadá zvláštně, vše z toho je legitimní postup.

Jak takové posloupnosti vypadají? Samozřejmě některé z nich stále odpovídají racionálním číslům (konstantní posloupnosti), ale nová p-adicky iracionální čísla jsou tam, kde jsme ještě nikdy předtím čísla neviděli. Předně neobsahují žádná klasická iracionální čísla, protože k nim se nemůžeme p-adicky přibližovat (stále detailnější desetinné aproximace nějakého iracionálního čísla se od něj p-adicky vzdalují nebo zachovávají vzdálenost 1). Nová čísla jsou posloupnosti, které se postupně liší ve stále větších a větších mocninách p.

Nyní nastává první případ, kdy poruším svůj zvyk neupínat se na notaci, protože v tomto případě nám používání číslic a číselné soustavy nijak neuškodí. Nyní totiž vychází z parametru p, který tyto systémy odlišuje, narozdíl třeba od desítkové soustavy pro reálná čísla, která nijak unikátní není. V tomto případě jednoduše rozdílná p vedou k rozdílným číselným množinám, ale naštěstí stačí stále jen p číslic pro reprezentaci čísel v nich.

Zatímco reálná čísla se dají zapsat pomocí nekonečné posloupnosti číslic za desetinnou čárkou, p-adická čísla umožňují nekonečnou posloupnost číslic před desetinnou čárkou, ale fanouškům nekonečna bych ještě jásat nedoporučoval, dokud nezjistíme, co všechno nám taková reprezentace umožňuje vyjádřit.

Začneme s p = 2, vzniknou tedy dyadická čísla (zde je vidět původ obecného názvu). Stačí nám tím pádem jen nuly a jedničky a čísla 0, 1, 10, 11, 100, 101 atd. Jako první můžeme zkusit číslo ...111111, tedy nekonečno jedniček. Je toto číslo nekonečné? Zkusme přičíst 1, tím dostaneme postupně ...111110, ...111100, ...111000 atd. Z dyadického pohledu se tyto výsledky stále zmenšují až na nulu (odebíráme vyšší a vyšší mocniny 2), takže, když přičtením 1 vznikne 0, ...111111 musí být vlastně −1!

Z dyadických čísel můžeme tím pádem hezky vyčlenit celá čísla, pokud ona nekonečná posloupnost vlevo představuje pouze samé nuly nebo samé jedničky. Toto chování by mělo být programátorům dobře známé, protože odpovídá dvojkovému doplňku, způsobu, jak ukládat do paměti záporná celá čísla. Máme-li třeba 8 bitů (dvojkových číslic), chceme, aby součet čísla a jeho dvojkového doplňku byl 2⁸ = 256; dvojkový doplněk čísla 7 (00000111) je tedy 249 (11111001) a přesně takto se uloží −7. To se navíc chová stejně nehledě na počet bitů, tedy si můžeme představit, že dyadicky vyjádřené záporné celé číslo je vlastně jen ve dvojkovém doplňku při dostatečně velkém počtu bitů, a k němu se dostaneme prostě tak, že otočíme všechny bity a přičteme 1. Samozřejmě velikost jakýchkoliv takto uložených čísel je v praxi omezená, takže se nakonec musíme dostat do situace, kdy se změní i ten nejvyšší bit (který zastupuje celou nekonečnou levou posloupnost) a dojde k přetečení.

Jaká další záhadná čísla dokážeme odhalit? Co třeba ...101010? Jakákoliv p-adická čísla tvoří těleso, takže si můžeme dovolit dělat klasické rovnice. Když x je ...101010, 2x je ...1010100 a tedy 3x = x + 2x je ...111110, nám už dlouho známé číslo −2, takže x jsou vlastně −2/3. Tím pádem i klasickou 1/3 dostaneme přičtením jedné a vznikne ...101011. Asi je jasné, že tento příklad nám rozbil jakoukoliv naději, že porovnávání čísel budeme moct dělat stejně jako doposud, a ve skutečnosti p-adická čísla nelze klasicky porovnávat vůbec (netvoří uspořádané těleso). Zároveň i zde se skrývá určité spojení s celočíselnou aritmetikou na procesorech – pokud v nějakém programovacím jazyce dělíte konstantou, která není mocninou 2, často se to převede na proces, jehož součástí je násobení oříznutou podobou dyadické reprezentace původního zlomku (např. dělení třemi vede k násobení číslem 2863311531, v dvojkové soustavě 10101010101010101010101010101011).

Jak poznat, co za dyadické číslo před sebou máme? Pokud je racionální, musí existovat od určitého řádu posloupnost číslic, která se opakuje (p-adická perioda). Pak tuto posloupnost rozšíříme do celého čísla a vznikne „zlomková část“ (ta bude ještě k tomu záporná). Když ji odečteme od původního čísla, už dostaneme klasické celé číslo, které nám umožní zjistit, jakého znaménka bylo číslo původní. V podstatě jsme provedli p-adické zaokrouhlení.

Reálná čísla povolují jen konečný počet číslic před desetinnou čárkou, a tak i p-adická čísla povolují jen konečný počet číslic za ní. Tím pádem dyadická jedna polovina musí být 0,1, aby její dvojnásobek byl 1. Zaokhrouhlování tím pádem máme dvojí; napřed se zbavíme dyadické zlomkové části (tedy součtu mocnin dvou, který se schovává za desetinnou čárkou), čímž vznikne dyadické celé číslo, a pak teprve můžeme odstranit nekonečnou posloupnost číslic.

Už tedy víme, že p-adická čísla umožňují zajímavým způsobem reprezentovat čísla racionální, ale zmínil jsem, že se jedná o jisté doplnění, tedy vzniknou i nová čísla. Tato čísla se dají reprezentovat neukončenou neperiodickou posloupností číslic směrem vlevo podobně jako iracionální reálná čísla (a můžeme tedy rozlišovat i spočitatelná p-adická čísla apod.). Nejsou tedy p-adická čísla svým způsobem ekvivalentní reálným? Algebraicky ne, protože třeba odmocniny ne vždy existují, pro p = 2 třeba neexistují vůbec. Oproti tomu v triadických číslech existují třeba dvě odmocniny z −2 a dalších čísel, ale ze 2 zrovna ne, takže už z tohoto může být zřejmé, že to opravdu nefunguje tak, jak jsme zvyklí.

I v případě, kdy posloupnost zlomků definující nějaké p-adické číslo definuje i číslo reálné, se tato dvě čísla mohou chovat odlišně, jednoduše z toho důvodu, že pro obě metriky je podstatné něco jiného. Z toho důvodu je lepší chápat každé těleso p-adických čísel jako doplnění o nové a unikátní prvky, které nemají přesnou obdobu v číslech reálných, a dokonce ani v jiných p-adických.

Chování těchto čísel může mnohým lidem připadat, že jsme na naší cestě spíš někde špatně odbočili, než že jsme stáli před volbou, ale svým způsobem jsou reálná čísla tím zvláštním případem. Dokonce další podobné doplnění racionálních čísel už neexistuje, takže z racionálních čísel vedou jen cesty do čísel reálných a p-adických. Proto se občas reálná čísla mohou analogicky značit ℚ_∞, kde ∞ zastupuje záhadný matematický objekt zvaný „prvočíslo v nekonečnu“, byť se jedná spíš o symbolickou než hluboce teoretickou entitu.

Reálná čisla samozřejmě nebyla konec cesty – vedla mimo jiné do čísel komplexních, která vznikla algebraickým doplněním, aby každá polynomiální rovnice měla řešení. Jde totéž udělat i s čísly p-adickými? Nu ano, pak vznikne algebraicky úplné nadtěleso p-adických čísel, ovšem zajímavý fakt je ten, že pro změnu nebude (narozdíl od ℂ) cauchyovsky úplné (tedy některé posloupnosti se blíží k neexistujícímu prvku). Když ho ovšem opět doplníme o tyto posloupnosti, vznikne těleso ℂ_p, komplexní p-adická čísla, jež jsou uzavřená z obou hledisek.

Na tomto místě se může zdát, že kromě reálných a komplexních čísel se nám tu vyrojilo nekonečno dalších čísel ℚ_p a ℂ_p na výběr, ale zdání leckdy klame. Ve skutečnosti je každé těleso ℂ_p až na onu metriku izomorfní s komplexními čísly ℂ, takže, z určitého úhlu pohledu, mohou být reálná i p-adická čísla vnímána jen jako část velké rodiny komplexních čísel. Nakonec je vlastně jedno, kdy se schopnosti porovnávání zbavíme.

K onomu izomorfismu je ovšem nutno dodat, že není ani zřejmý, ani jednoznačný. Jistá symetrie komplexních čísel se projevuje i tady, tedy odmocnina z −1 může být jak i, tak −i, a je na nás, který výsledek ztotožníme s nějakou algebraickou p-adickou odmocninou z −1. Zároveň je důležité si uvědomit, že ℂ a ℂ_p jsou nerozlišitelné jen jako tělesa, takže jiné konstrukty (porovnávání nebo absolutní hodnota), které jsou vázané na jejich konkrétní podobu, se mohou lišit.

Snažil jsem se přijít na nějakou vizuální reprezentaci p-adických čísel, která by zapadala do světa, který jsem vymýšlel doposud, ale žádná uspokojivá mě nenapadá. Takový svět je bez jasných směrů, bez jasných vzdáleností, nekonečný, ale opakující se, fraktálový, ale přesto hladký. Možná je takový svět na kvantové úrovni; jisté náznaky toho by tu byly, a to by možná potom znamenalo, že podstatou celého světa jsou komplexní čísla, reálná na makroskopické a p-adická na mikroskopické úrovni. Těžko říct, jestli se to někdy dozvíme.