Chceme být pro vědce partnery

Chtěl bych minimálně obnovit postavení, které ústav měl v 90. letech, kdy byl špičkovým pracovištěm v oblasti použití počítačů v akademickém prostředí.

Profesor Luděk Matyska patří v Česku i v mezinárodním prostředí k uznávaným odborníkům v oblasti vysoce výkonných počítačových systémů využívaných pro vědecké účely. Někdejší děkan fakulty informatiky a profesor na katedře počítačových systémů a komunikací se v lednu stal novým ředitelem Ústavu výpočetní techniky MU. Chce mu vrátit renomé českého lídra v oblasti použití počítačů pro akademické účely.

Jste původem vystudovaný biochemik. Jak se člověk od takového oboru dostane k informatice?
Počítači jsem se zabýval už na střední škole, ale bavila mě i chemie, a tak jsem šel studovat biochemii. I tehdy na vysoké škole na přelomu 70. a 80. let jsem však byl docela známým uživatelem prvních počítačů, které si Masarykova univerzita pořídila. A také moje diplomová práce byla hodně spojena s matematickým a počítačovým zpracováním biochemických dat. K informatice jsem tedy přirozeně tíhnul.

Po škole jste však stejně šel pracovat do výzkumu v Lachemě.
Měl jsem trochu problémy se zaměstnáním, což bylo dáno mým tehdy nevyhovujícím rodinným původem. Ani v Lachemě jsem ale neskončil v biochemické laboratoři. Dělal jsem tam počítačem řízenou organickou syntézu. Když jsem pak v roce 1989 přešel do ústavu výpočetní techniky, už jsem se od informatiky nehnul.

Co vás tehdy na konci 70. let na počítačích tak lákalo?
Bylo to něco úplně nového. Navíc matematika pro mě byl naprosto přirozený nástroj, studoval jsem ostatně na matematicky založeném gymnáziu, na brněnské Jarošce. První počítače, které se tehdy začaly v republice objevovat, nabízely zajímavé možnosti, jak právě s matematikou pracovat. Je dost možné, že kdybych hned po škole našel práci zaměřenou na biochemii, tak by se moje kariéra vyvíjela jinak, ale pravděpodobně bych se i tak motal kolem počítačového zpracování biochemických dat.

Přírodní vědy vás naučí jisté pokoře. Zjistíte, že všechno nespočívá jen v tom, jestli něco dobře naprogramujete.

Zajímala vás tedy vždy hlavně aplikace informatiky?
Teoretická informatika nebyla nikdy nic pro mě. Zajímalo mě, jak mohou počítače pomoct jiným vědám. A to dělám dodneška. Ve světě to není zas tak neobvyklý vývoj kariéry. Lidé, kteří mají podobné pozice jako já, tedy že řídí někde výpočetní nebo superpočítačová centra, zpravidla nejsou informatici, ale původem fyzici nebo chemici.

Čím to je?
Mám hypotézu. Domnívám se, že informatika se neučí úplně nejšťastněji. Vychovává teoretiky, a to dobré, ale nepřipravuje je úplně vhodně na praxi. Chybí jim totiž něco, co dají člověku přírodní vědy. Přijdete do laboratoře, jste přesvědčen, že víte přesně, co a jak uděláte, jenže materie si řekne, že prostě ne. A experiment nedopadne.

Co z toho pro člověka vyplývá?
Naučí vás to jisté pokoře. Zjistíte, že všechno nespočívá jen v tom, jestli něco dobře naprogramujete. Informatici ovšem ze školy vycházejí s tím, že když si sednou a napíšou skvělý kód, tak přírodu obejdou.

Říkal jste, že už na konci 70. a 80. let jste se na univerzitě točil kolem počítačů. Jak to zde po IT stránce vypadalo?
Nejsem úplně nejlepší pamětník. Ale byl jsem tehdy velký nadšenec a věděl jsem prakticky o veškeré výpočetní technice, která na univerzitě byla. Začínaly se tu objevovat první velké sálové počítače, se kterými se pracovalo pomocí děrných štítků, a zpracování bylo dálkové. Jeden den jste odevzdal program na štítcích a nejdříve druhý den jste si přišel pro výsledek.

To zní dost nepružně.
Dnes už si to studenti nedovedou moc představit. Bylo to hodně neodpouštějící. Sedl jste si a naťukal do děrných štítků zadání úlohy a druhý den zjistil, že jste někde udělal místo tečky čárku a nespočítalo se nic. Takže opravit a celé znovu. Naštěstí se nám občas podařilo přemluvit provoz, nechali nás se sálovým počítačem pracovat přes noc a mohli jsme si to pohlídat.

A u velkých počítačů jste zůstal dodnes. Respektive u superpočítačů. Nebo mě hned opravíte?
Dá se říct, že jednu dobu to oblast mého zájmu byla, ale je potřeba si uvědomit, že v České republice opravdový špičkový superpočítač nikdy nebyl a zřejmě ani nebude. Možná se to povede v Ostravě, ale mám jisté pochybnosti, jestli se dostanou do té skutečně nejvyšší superpočítačové třídy.

Všechno nespočívá jen v tom, jestli něco dobře naprogramujete.

Jak to?
Je to poměrně elitní klub a situace se rychle mění. Existuje žebříček top 500 nejvýkonnější strojů světa a Česko jen jednou mělo stroj, který by byl někde u konce, ale než se vydal nový žebříček, spustilo se tolik výkonnějších počítačů, že se tam nedostal.

Přesto v Česku a na MU vznikají centra, která se někdy laicky jako superpočítačová označují. Co tedy jsou?
Zhruba od poloviny 90. let se oblast budování výkonných počítačů rozpadla do dvou skupin. Jedna se zaměřila na absolutní výkon a zajímá se o nejvýkonnější stroje, které lze vůbec zkonstruovat. Jejich pořizovací cena je ovšem v mnoha desítkách či spíše stovkách milionů dolarů a mohou si je tak dovolit jen nejbohatší země světa jako USA, Japonsko, Německo a v poslední době třeba i Čína. Druhá skupina se více zaměřila na nejlepší využití toho, že běžná PC jsou propojena rychlou sítí a dohromady tak poskytují výkon plně srovnatelný s tím, co nabízí nejvýkonnější a nejdražší superpočítače. Výkony rostou tak rychle, že na to, na co se před pěti lety plánovalo pořízení superpočítače, vám stačí už jen pár desítek spojených PC. Takto spojeným počítačům se začalo říkat clustery, a aby se dosáhlo ještě větších výkonů, začaly se tyto clustery napříč zeměmi spojovat. Dnes jsme i my zapojení do evropské sítě nazývané Evropská gridová infrastruktura (EGI), která má k dispozici více než čtvrt milionu počítačových jader.

To, že počítač není na jednom místě, ale že se využívá strojů, které jsou od sebe vzdálené třeba tisíce kilometrů, musí ale výpočty zpomalovat.
To víte, že ano. Trik je v tom, že celá řada zpracování vědeckých výpočtů, ke kterým se tyto sítě využívají, nepotřebuje okamžitý maximální výkon. Stačí jim jen část. Případně se řešený problém dá rozložit do řady menších úloh. Rozřežete si to jako salám na kolečka a na zpracování jednoho kolečka vám stačí například čtyři PC. Celý salám tvoří třeba tisíc koleček, takže chytře zaměstnáte čtyři tisíce PC.

Ono totiž využít výkon velkého superpočítače tak, abyste věci dělali skutečně násobně rychleji, než když máte nějaký malý cluster, je poměrně složité. Stále se ještě hledají cesty, jak to dělat. K tomu, abyste jednoduše přišel k superpočítači se 130 tisíci procesory, zadal mu úlohu a on ji dělal 130tisíckrát rychleji než počítač s jedním procesorem, máme ještě daleko.

K čemu konkrétně se dá ve vědě využít taková výpočetní síla?
Skoro k čemukoliv, co vás napadne. V těch největších výkonech jsou to zpravidla simulace, tedy modelování reálného světa nebo jeho kousku. Řada odborníků včetně profesora Grusky z naší fakulty informatiky již dlouho uvádí, že modelování přes počítače je třetí metodologie vědy. V některých případech je to dokonce jediná cesta, jak lze ověřit hypotézu. Můžete tak modelovat, co se třeba stane, když se srazí dvě černé díry. V laboratoři si to totiž těžko zkusíte. Podobné využití můžete najít u některých mikroskopických jevů, k jejichž pozorování v přirozeném stavu nám schází technologie.

Proč je potřeba tak vysoká kapacita? Je to náročností výpočtů?
Buď, anebo velkým množstvím dat, které je potřeba zpracovat. Představte si, že chcete třeba namodelovat, co se stane, až se za nějakých osm miliard let srazí naše galaxie s mlhovinou v Andromedě. Galaxie představuje asi 150 miliard sluncí, mlhovina je trochu menší. Když si vezmete takový systém a chcete sledovat, co bude každá jedna jeho částice dělat příštích několik miliard let, to je opravdu obrovské množství výpočtů. Podobně náročné je zpracování dat z nejrůznějších měřicích přístrojů třeba bioinformatiků, kteří studují genom. Mají přístroje, které vám za den provozu nasbírají terabajty dat. Ta musíte nějak zpracovat, musíte je někam ukládat a pak v nich ještě umět vyhledávat. A počet podobných přístrojů stále roste. Jen v Evropě se odhaduje, že jich bude kolem roku 2015 tisícovka.

Je tedy potřeba vymýšlet, jak tyto výpočty dělat co nejrychleji a co nejefektivněji. To děláte i vy?
V současnosti se moje práce týká hlavně toho, jak má vypadat infrastruktura, kterou můžete k výpočtům používat. Řečeno správnými termíny: zabývám se architekturou distribuovaného systému. Stál jsem třeba u zrodu něčeho, čemu se dnes říká logging and bookkeeping. Je to v EGI rozšířená služba, která vám dovoluje sledovat, jak vaše úloha běží v distribuovaném prostředí a co se s ní děje. Obecně řeším otázky, jak dělat infrastrukturu co nejlépe využitelnou a odstraňovat překážky, které stojí před uživateli.

Kromě toho před sebou ale máte ještě řadu manažerských úkolů. Od začátku roku jste ředitelem Ústavu výpočetní techniky MU. Jaké máte plány?
Chtěl bych minimálně obnovit postavení, které ústav měl v 90. letech, kdy byl skutečně špičkovým pracovištěm v oblasti použití počítačů v akademickém prostředí. S tím souvisí fakt, že chci posílit vědeckou složku ústavu. Příliš totiž podle mne uhnul do servisních oblastí. Zní to možná paradoxně, protože univerzita se na nás zlobila, že toho děláme málo. To ale bylo podle mě z velké části nedorozumění v tom, co jsme mysleli, že máme dělat my, a co si myslelo vedení univerzity.

Musíme posílit spolupráci s vědeckými týmy uvnitř univerzity a rozumně i mimo ni.

Jak toho chcete dosáhnout?
Musíme zapracovat na změně povědomí o tom, co ústav umí a dělá. Když si budou lidé myslet, že se jen staráme o síť a že umíme vytvořit informační systém na správu projektů, těžko nás budou vnímat jako partnery ve vědeckých projektech. Musíme posílit spolupráci s vědeckými týmy uvnitř univerzity a rozumně i mimo ni. Cílem je, aby se jakýkoliv vědecký tým víceméně automaticky obrátil na ústav, pokud řeší nějaký informatický problém, a zbytečně se nepokoušel řešit to sám a vlastně tak ztrácel čas s něčím, co není jeho specializace.

S čím dokážete třeba pomoci?
To by bylo na dlouhé povídání, ale máme příklady, kdy přišli lidé, jejichž programy prováděly zásadní výpočty dlouhé hodiny. Když se na to ale podíval náš expert, tak zjistil, že program celou dobu pracuje s diskem, ale s procesorem jen vteřiny. Po relativně jednoduchých úpravách, které jsme udělali, výpočty trvaly pouhé minuty. Takové řešení nemusí být jen časová úspora, vědci to může otevřít nové perspektivy v tom, co si vlastně může dovolit zkoumat.

Jak od své práce odpočíváte?
Bydlím v domě hned naproti fakulty informatiky, takže moc nevnímám hranice mezi domovem a prací. Nejvíc ale odpočívám tím, že čtu papírové knihy, hlavně fantasy a sci-fi. Používám to částečně i jako testy prognóz toho, co by mohlo být a jak moc daleko ještě jsme od některých věcí.

Je to i inspirace?
Do jisté míry ano. Nejnovější technické sci-fi dnes často píšou lidé, kteří mají doktorát z fyziky nebo z chemie na nějaké velmi slušné americké univerzitě, a píšou tím pádem o věcech, které vypadají velmi realisticky.

Nepropadl jste ještě populárním elektronickým čtečkám?
Papír je papír. Navíc mám koukání do obrazovek v práci dost. Je také dobré, že knihy vás rozumně omezují. Kdybych měl kapacitně prakticky neomezenou čtečku, tak bych snad nedělal nic jiného, než že bych četl.

Masarykova univerzita | Masaryk university