Komerční prezentace
Registrace uživatele

Přihlašte se k odběru informací, novinek, získejte přístup do diskuzního fóra.

Vesmír č. 10
Vesmír č. 10
Toto číslo vychází
2. 10. 2017
Novinky
Zdarma jedno celé číslo Vesmíru v pdf.
• Říjnové číslo Vesmíru
reklama

Origamová geometrie

Co nelze zkonstruovat?

< předchozí | seriál: Origamová geometrie |
Publikováno: Vesmír 92, 645, 2013/11

Tato třetí část příběhu (viz Vesmír 90, 462, 2011/7; 90, 524, 2011/9) bude sice nejtěžší, ale také nejkrásnější a nejpřekvapivější. Půjde v ní o přesné vymezení toho, co se dá zkonstruovat a co se nedá zkonstruovat pomocí pravítka a etalonu. Stejně jako v částech předcházejících zde nepůjde ani o skládání papíru, ani o konstrukce pomocí pravítka a etalonu; to snad lze pokládat za „zábavnou geometrii“ (a jistě ještě s dodatkem: jak pro koho), praktický smysl to ale nemá žádný. Ale buďme opatrnější: praktický smysl či „užitečnost“ závisí přece na tom, do jakých rukou se to dostane. Celý tento příběh zde vyprávím proto, aby se ukázalo, jakými zvláštními obraty se vyvíjí matematika (a věda) vůbec. Ukázat se to může jen na něčem velmi konkrétním, ale o toto něco zde nakonec vůbec nejde.

Nuže pokročme už kousek dál v našem příběhu. Descartes provedl první velký obrat, tj. revoluci, v matematice od dob antické vědy. Součástí této revoluce byla algebraizace geometrie: Descartes začal počítat s úsečkami jakožto veličinami. Geometrické problémy pak mají vždy tvar: dány jsou nějaké úsečky (Descartes je označí malými písmeny ze začátku abecedy: a, b, c, …) a máme najít nějaké úsečky neznámé (ty Descartes označí malými písmeny z konce abecedy: x, y, z). Udělá se to tak, že se najde dostatečný počet vztahů (poměrů) mezi známými a neznámými úsečkami, s těmito vztahy se pak počítá algebraicky tak dlouho, až se dostanou algebraické rovnice pro neznámé veličiny a řešení těchto rovnic je pak řešením dané geometrické úlohy. Podívejme se na něco jednoduchého, co se nám ještě bude hodit: Máme dány úsečky a a b a máme najít úsečku x = √(ab). Z podobnosti trojúhelníků dostaneme a : x = x : b, a tedy x2 = ab. Zde nám k řešení úlohy stačilo pravítko a kružítko.

Složitější úlohy mohou vést k rovnicím vyšších stupňů a otázka zní: Jaké prostředky potřebujeme pro (geometrické) řešení dané rovnice? Ve většině případů nebude stačit pravítko a kružítko; tyto nástroje totiž dokáží vyřešit jen kvadratické rovnice a rovnice, které se na rovnice kvadratické dají převést (rozložit). Můžeme však použít nějaká složitější geometrická zařízení. Řešení takových rovnic jsou průsečíky algebraických křivek, tj. křivek, které jsou popsány polynomy (například v souřadnicích x a y). A takové křivky se dají nakreslit pomocí kloubových mechanismů, o nichž jsem psal v minulém příběhu. Všimněme si ještě koeficientů, které se vyskytují v našich polynomech: jsou to opět polynomy v daných úsečkách a, b, … s racionálními koeficienty.

Připustíme-li konstrukce pouze pomocí pravítka a etalonu, můžeme úsečky sečítat, odečítat, násobit, dělit a dále můžeme pro dané úsečky a a b zkonstruovat úsečku √(a2 + b2) (k tomu stačí úsečky jen přenášet a v posledním případě udělat z úseček a a b odvěsny pravoúhlého trojúhelníku – jeho přepona pak bude právě ona odmocnina).

Teď to otočíme a položíme naši hlavní otázku: Jaké konstrukce lze těmito prostředky provádět a jaké ne? Tuto otázku jsme ale už převedli na otázku algebraickou.

Začneme jednou danou úsečkou, kterou prohlásíme za úsečku jednotkovou. Zvolíme dvě souřadnicové osy, přeneseme na ně tuto jednotkovou úsečku a začneme zjišťovat, jaké body můžeme vypočítat pomocí zmíněných operací: sečítání, odečítání, násobení, dělení a odmocňování součtu dvou druhých mocnin. Jde tedy o to, co můžeme dostat z čísla 1 postupným sečítáním, odečítáním, násobením, dělením – zatím je to jasné: to jsou přece zlomky, tedy racionální čísla. My ale můžeme počítat √(a2 + b2), kde a, b jsou už vypočtená racionální čísla, výsledek přidat a zase sečítat, dělit, odmocňovat atd. A tak donekonečna.

Řekněme to teď jinak: množina těch bodů, které můžeme vypočítat (tedy zkonstruovat pomocí pravítka a etalonu), sestává z těch bodů, jejichž souřadnice patří do nejmenší množiny, která obsahuje 1 a je uzavřená vůči sečítání, odečítání, násobení, dělení a výpočtu druhé odmocniny součtu dvou čtverců. Uzavřeností se zde rozumí, že obsahuje-li tato množina čísla a a b, pak obsahuje i a + b, ab, ab, a/b, √(a2 + b2) . Poznamenejme zde ještě, že tam patří například i √(a2 + b2 + c2), protože tato odmocnina se rovná

√(a2 + (√ (b2 + c2 ))2 ).

Takto vypočteme (a tedy zkonstruujeme) nekonečně mnoho bodů roviny, zdaleka ne ovšem všechny. Množství všech vypočtených bodů je spočetné (tj. je jich stejně jako přirozených čísel 1, 2, 3…), zatímco všech bodů v rovině je nespočetně mnoho. Přesto je tato prořídlá rovina zajímavá. Teď se ale ocitneme v dalším – tentokrát velkém příběhu.

V roce 1899 vyšlo poprvé „paradigmatické“ dílo Davida Hilberta Základy geometrie. Paradigmatické bylo proto, že se stalo vzorem (paradigmatem) dokonalých axiomatických systémů a pozvedlo matematiku na novou a vyšší úroveň dokonalosti. Hilbert pojal geometrii jako formální systém, v němž jsou pojmy jako „bod“ nebo „přímka“ vymezeny implicitně, tj. definovány vztahy, které musí splňovat. Nemá pak smysl klást otázky, jako „co je to bod?“. Pozdější terminologií řečeno to byl čistě strukturalistický přístup: nezajímáme se o prvky samotné, nýbrž jen o vztahy mezi nimi. Tento „strukturalistický“ přístup je přítomen už u Eukleida; přihlouplé definice bodu a přímky byly do Eukleidových Základů dodány později nějakým „metodikem“. Jako důkaz může postačit to, že Eukleidés tyto definice nikde nepoužil a ani nepotřeboval.

Pro formální systémy či struktury můžeme ovšem konstruovat modely, a tak jim dodat „tělo“. V nejznámějším modelu elementární geometrie (v rovině) je bodem dvojice reálných čísel („souřadnic“ tohoto bodu), přímky jsou reprezentovány lineárními rovnicemi atd. Všechny axiomy jsou splněny, a tak tento model může posloužit i jako důkaz bezespornosti daného axiomatického formálního systému (za předpokladu bezespornosti systému reálných čísel – dnes bychom řekli atd. do nekonečna). Existují však i méně obvyklé, „nestandardní“ modely elementární geometrie v rovině. Například tento, který vychází z obyčejné roviny, z níž vyjmeme jeden bod O. Body pak budou všechny zbývající body roviny, přímkami však budou kružnice, které procházejí (odstraněným) bodem O. Všechny axiomy jsou splněny; chcete-li, zkuste si rozmyslet, jak v tomto modelu vypadá rovnoběžka k dané přímce procházející bodem mimo ni, nebo si nakreslete trojúhelník (bude sestávat z oblouků tří přímek-kružnic) a přesvědčte se, že součet úhlů je roven dvěma pravým.

Neřekli jsme si ale zatím vůbec, jak Hilbertovy axiomy vypadaly, a ani to neuděláme, protože to k pochopení tohoto příběhu nepotřebujeme. Bude nám stačit to, že jsou rozděleny do pěti skupin: první se týká incidencí (bod leží na přímce, dvě přímky se protínají v bodě atd.), druhá uspořádání (daný bod leží mezi jinými danými body atd.), třetí kongruence čili shody (kdy jsou dvě úsečky nebo dva úhly shodné), čtvrtá skupina obsahuje axiom o rovnoběžkách (bodem mimo danou přímku lze vést jedinou rovnoběžku). Pátá skupina sestává ze dvou axiomů (nazývaných axiomy spojitosti): jedním je archimedovský axiom, který zaručuje možnost měření, a druhým je axiom, který má povahu zcela odlišnou od axiomů předcházejících – požaduje, aby to, co bude splňovat všechny předcházející axiomy, bylo „úplné“ v tom smyslu, že se to už nedá rozšířit na něco bohatšího. Teprve tento trochu podivný axiom zaručuje, že bodů v rovině bude „dostatek“, dokonce, že jich bude „akorát tolik, kolik jich má být“.

A teď možná překvapení: ta „řídká“ geometrie, v níž body jsou jen to, co se dá získat sečítáním, odečítáním, násobením, dělením a odmocňováním součtu čtverců (tedy to, co se dá udělat obyčejným skládáním papíru nebo pravítkem a etalonem), splňuje všechny Hilbertovy axiomy s výjimkou posledního (úplnosti). Hilbert tak v Základech dokázal, že poslední axiom je nezávislý na ostatních axiomech, tedy že z nich nemůže být odvozen. Udělal to proto tak, že zkonstruoval model, v němž platí všechny axiomy kromě axiomu posledního.

Stále však nemáme pořádnou odpověď na výchozí otázku: co lze a co nelze zkonstruovat pravítkem a etalonem. Co je to za čísla, která dostaneme uvedenými algebraickými operacemi? Jak se liší od těch čísel, která lze zkonstruovat pravítkem a kružítkem – a liší se vůbec? To, co lze zkonstruovat pravítkem a kružítkem, se dostane podobně: základními algebraickými operacemi a neomezeným odmocňováním: výpočtem druhých odmocnin i z jiných výrazů než jen součtu čtverců, například √(a2b2). To totiž pak dovolí řešení kvadratických rovnic, což stačí k výpočtu průsečíků přímky a kružnic nebo dvou kružnic (nic složitějšího při konstrukcích pravítkem a kružítkem nepotřebujeme).

Takže: co je to za čísla? Odpověď na tuto otázku dal rovněž David Hilbert v citované knize. Rozhodně jsou to čísla algebraická, tj. jsou to kořeny algebraických rovnic s racionálními koeficienty. Nyní začne náš příběh stoupat stále strměji do vysokých pater matematiky, a abychom jej vůbec dokázali sledovat, budu jej muset vyprávět ve zjednodušené podobě, bez pořádných definic a samozřejmě bez důkazů. Přesto si myslím, že se vyplatí jej sledovat, protože vypovídá o tom, jak nepředvídatelnými cestami se vyvíjí matematika a věda vůbec.

Zpočátku bude stoupání ještě poměrně mírné. Dané algebraické číslo je tedy kořenem nějakého polynomu s racionálními koeficienty. Takových polynomů je ovšem nekonečně mnoho. Zvolíme ten, který je nejjednodušší, minimální, tj. takový, který už nelze rozložit na polynomy jednodušší (říká se mu „ireducibilní“). Tento polynom má ovšem ještě další kořeny (zvané konjugované). Pokud jsou všechny tyto kořeny reálné, nazývá se výchozí algebraické číslo totálně reálné. Dá se dokázat, že pokud jsou (algebraická) čísla a, b totálně reálná, jsou totálně reálná i čísla a + b, a – b, ab, a/b, √(a2 + b2) . Racionální čísla jsou samozřejmě totálně reálná (pro racionální číslo r je odpovídající ireducibilní rovnice prostě xr = 0).

Všechna čísla, která můžeme zkonstruovat (pravítkem a etalonem), jsou tedy totálně reálná. To Hilbertovi stačí k tomu, aby předvedl příklad konstrukce, kterou lze uskutečnit pravítkem a kružítkem, nikoli ale pravítkem a etalonem: Sestrojit trojúhelník, když je dána přepona c a jedna odvěsna a. Jde tedy o výpočet (konstrukci) b = √(c2a2). Pravítkem a kružítkem se udělá snadno (viz obrázek výše s polokružnicí). Pravítkem a etalonem to nejde. Například (Hilbert) když c = 1, a = |√2| – 1, pak

b = √(12 – (|√2| – 1)2) = √(2|√2| – 2).

b není totálně reálné číslo. Lze se o tom přesvědčit tak, že nalezneme nejjednodušší rovnici (s racionálními koeficienty!), kterou toto číslo splňuje x4 + 4x2 – 4 = 0, takže x2 = –2 ± 2|√2| a dva kořeny jsou imaginární (protože na pravé straně může být záporné číslo).

Geometrická úloha začíná tím, že jsou dány nějaké úsečky a máme zkonstruovat nějakou jinou úsečku, která je funkcí těchto úseček. Dané úsečky můžeme pokládat za parametry geometrické úlohy a řešení úlohy je pak funkcí těchto parametrů. Řekneme teď jinými slovy to, k čemu jsme dospěli: Jestliže tato funkce f(a,b, …) se dostane z parametrů a, b, … sečítáním, odečítáním, násobením, dělením a odmocňováním a jestliže tato funkce pro všechny reálné hodnoty parametrů dá totálně reálné číslo, pak se při jejím výpočtu mohou provádět odmocniny jen ze součtu čtverců dvou čísel.

Kritérium toho, zda lze či nelze nějakou konstrukci uskutečnit pomocí pravítka a etalonu, bude tedy spočívat v tom, zda dokážeme dosáhnout toho, abychom při odmocňování odmocňovali vždy výraz sestávající ze součtu čtverců. To by šlo, pokud bychom uměli dokázat následující tvrzení. Pro jeho formulaci potřebujeme ještě připomenout, že racionální funkcí parametrů (proměnných) a, b,… (s racionálními koeficienty) se rozumí výraz, který se dostane sečítáním, odečítáním, násobením a dělením parametrů; každá taková funkce je tedy podílem polynomů parametrů s racionálními koeficienty. A potřebné tvrzení zní takto:

Každou racionální funkci parametrů s racionálními koeficienty, jež pro všechny reálné hodnoty parametrů nabývá nezáporných hodnot, lze vyjádřit ve tvaru součtu čtverců racionálních funkcí parametrů s racionálními koeficienty.

Můžeme tušit, že důkaz této věty nebude nic jednoduchého. Její dávný předchůdce, který pochází od Fermata a který říká, že každé přirozené číslo lze vyjádřit jako součet (nejvýše čtyř) čtverců přirozených čísel: 2 = 12 + 12, 3 = 12 + 12 + 12, 4 = 12 + 12 + 12 + 12, 5 = 22 + 12, 6 = 22 + 12 + 12, 7 = 22 + 12 + 12 + 12 atd., si musel na důkaz počkat dlouho; velkému Eulerovi se to nepodařilo, až Lagrangeovi v roce 1840.

A opravdu. Hilbertovi se podařilo dokázat složitě tuto větu jen pro případ jednoho parametru. O něco později (1903) tento důkaz zjednodušil Edmund Landau (slovo zjednodušil bychom měli dát do uvozovek, protože jeho důkaz má dvanáct stránek spletitých úvah a výpočtů). Když se v srpnu roku 1900 konal v Paříži památný druhý mezinárodní kongres matematiků, vystoupil na něm David Hilbert s přednáškou, začínající poněkud patetickými slovy: „Kdo by si nepřál poodhalit roušku, za níž se skrývá budoucnost, aby uviděl pokrok naší vědy a tajemství jejího rozvoje v budoucích staletích?“ Pak ve své přednášce o budoucích problémech matematiky podal seznam 23 problémů, jejichž řešení by mohlo ovlivnit vývoj matematiky v nadcházejícím století. Pro přednášku jich vybral jen deset, všechny pak otiskl v témže roce německy a později francouzsky v aktech tohoto kongresu. Nemýlil se, šlo o zcela mimořádnou událost, která neměla obdoby ani v minulosti, ale dodnes ani – jak se ukázalo – v budoucnosti (i když se mnozí pokoušeli sestavovat různé seznamy problémů). Ne všechny Hilbertovy problémy byly formulovány ostře, některé spíše připomínaly programy, takže odpověď na otázku, jak to vypadá po sto letech, není zcela jednoznačná, ale obecně se soudí, že za vůbec nevyřešené lze pokládat už jen tři problémy (6, 8 a 16).

Problém, o němž jsme hovořili, dostal číslo 17 a dočkal se řešení poměrně brzy – po necelých třiceti letech. Jeho řešení znamenalo podstatný pokrok v moderní („abstraktní“) algebře a její první všeobecné uznání. Řešení přišlo v roce 1927 od Emila Artina (1898–1962), který krátce předtím společně s Otto Schreierem (1901–1929) rozvinul teorii formálně reálných těles. „Těleso“ je jednou ze základních struktur algebry. Český název je prostým překladem německého termínu „Körper“ a je třeba mu rozumět v tom smyslu, v němž se vyskytuje ve spojeních jako „hudební těleso“ čili jako „korpus“, tj. jako soubor. Podobně je tomu i s dalšími názvy algebraických struktur: okruh, grupa: jsou to (nepříliš vynalézavá) označení různých struktur, tedy souborů (množin) s nějakými operacemi. Těleso je množina, na níž jsou definovány operace sečítání, odečítání, násobení a dělení, splňující přirozené požadavky, vyjádřené jako axiomy. S tělesy jsme se už setkali: racionální čísla, reálná čísla nebo čísla komplexní s obyčejným sečítáním atd. jsou tělesa, právě tak i to, co jsme dostali výše z racionálních čísel opakovaným sečítáním, odečítáním, násobením, dělením a odmocňováním součtu čtverců. Tato tělesa jsou navíc uspořádaná, tj. je tam definován vztah „být menší než“, který rovněž splňuje obvyklé požadavky. Tělesem je také množina racionálních funkcí s racionálními koeficienty.

Artinovi a Schreirovi se podařilo touto abstrakcí vyjasnit Hilbertův problém a objevit to, na čem skutečně záleží, natolik, že Artin pak mohl podat úplné řešení. Takové postupy se v matematice občas vyskytují: místo původní úlohy se vyřeší zdánlivě mnohem obtížnější obecná úloha – a ukáže se, že snadněji než úloha původní.

V tělese komplexních čísel platí i2 = –1. Taková tělesa je třeba vyloučit: formálně reálným tělesem se nazývá těleso, v němž nemůže být součet čtverců jeho prvků roven –1, nebo jinak řečeno: je-li součet čtverců nějakých prvků nulový, musí být tyto prvky nulové. Artin pak dokázal toto tvrzení: součty čtverců ve formálně reálném tělese jsou přesně ty prvky, které jsou při všech uspořádáních tohoto tělesa kladné (jsou „totálně kladné“). Odtud pak už Artin mohl odvodit Hilbertovu domněnku: Máme dáno formálně reálně těleso, které připouští jen jedno uspořádání (a toto uspořádání je archimedovské). Pak každá racionální funkce f(x1, x2, …xn), která nenabývá záporných hodnot pro žádné hodnoty z tělesa, je součet čtverců v racionálních funkcích proměnných x1, x2, …xn.

Snad to bylo možné aspoň „globálně“ sledovat; přesnější formulace by byly neúnosně složité a zde zcela zbytečné. K pořádnému výkladu je nezbytné se obrátit k lepším učebnicím algebry (například ke klasické americké učebnici S. Langa).

Vypadá to, že zde by náš příběh mohl skončit. Není tomu ale tak. Artinův důkaz je totiž důkaz „existenční“: dokázána je jen existence takových funkcí, součtem jejichž čtverců je daná funkce. Není podán ani náznak, jak by se takové funkce daly najít. Pro jistotu dvě kratičká objasnění. První se týká pojmu existenčního důkazu a pomohu si jednoduchým příkladem: Budeme-li mít 999 krabiček a budeme-li vědět, že je v nich tisíc kuliček, pak víme, že existuje aspoň jedna krabička, v níž jsou přinejmenším dvě kuličky. Důkaz je prostý: kdyby v každé krabičce byla jen jedna kulička, tisící by nám zbyla. Tento existenční důkaz ale nepodává vůbec žádnou informaci o tom, v které krabičce jsou aspoň dvě kuličky. Musíme je prohledat (a budeme na to v průměru potřebovat otevřít zhruba 500 krabiček); víme jen, že hledání nebude marné. A druhé objasnění se týká toho, k čemu by nám to v našem případě mohlo být dobré; kdyby ten důkaz byl konstruktivní, tj. byl návodem na nalezení potřebných funkcí, pak by bylo možné naprogramovat počítač tak, aby za nás řešil úlohy geometrie pravítka a etalonu. Nesmíte se ale moc ptát, k čemu by nám to nakonec bylo dobré. V tomto případě třeba k ničemu, ale někde by mohly číhat problémy užitečné, které by se mohly vyřešit podobně.

Nuže na odpověď na tuto poslední otázku se muselo počkat dalších třicet let a přišla z oblasti, v níž by to asi nebyl čekal ani velký Hilbert. V roce 1955 zveřejnil jeden z významných logiků minulého století Abraham Robinson výsledky týkající se zhruba řečeno metamatematiky algebry. Na ně o dva roky později navázal Georg Kreisel, další významný logik a přítel Kurta Gödela, a popsal explicitní metodu konstrukce hledaných funkcí (součet jejichž čtverců je pak roven zadané funkci). Když se s tím Artin seznámil, podotkl prý, že by přece jen dal přednost čistému existenčnímu důkazu před konstrukcí vyžadující 22100 kroků.

Co se dělo pak, nevím, nevím ani, zda se něco dalšího dělo. Můj odhad je, že Kreiselův algoritmus je beznadějně složitý. Nikoli ovšem ve smyslu nějaké spletitosti, nýbrž proto, že vyžaduje příliš mnoho kroků na to, aby vůbec dal i na nejrychlejších počítačích nějaké výsledky za rozumnou dobu. A odhadoval bych, že někdo už dokázal (nebo dokáže), že v principu žádný rychlejší algoritmus neexistuje. Ale také třeba, že existují nějaké rozumné algoritmy, které nevyřeší všechny námi zkoumané geometrické problémy, avšak všechny „rozumné“ (či „generické“) ano – ovšem s tím, že musíme rezignovat na nějaké formální kritérium rozumnosti problému.

Můžeme my vlastně vůbec říci o nějakém problému, že byl s definitivní platností vyřešen?

Soubory

článek ve formátu pdf: 201311_645-647.pdf (784 kB)

Diskuse

Žádné příspěvky