DynamickýPřekladPrakticky

Z Denik

Verze z 17. 6. 2021, 13:37; 141.143.193.76 (diskuse)

(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

Seminář na MatFyz pro letní semestr 2019, který pokračuje na jaře 2021.

Obsah

1 Dynamický Překlad Prakticky
2 Osnova přednášek

Dynamický Překlad Prakticky

Jaký je nejrychlejší programovací jazyk? Může být JavaScript rychlejší než Céčko? Existuje jednoduchý způsob, jak si napsat jazyk, který bude opravdu rychlý? Musíme opravdu psát všechny knihovny znovu a znovu? Jak se implementuje debugger? A jak profiler? Kolik to dá práce? To jsou otázky, na které v průběhu semináře budeme hledat a nalezneme odpovědi.

Budeme používat GraalVM, což je nejrychlejší virtuální stroj, který shodou okolností pomáhá vyvíjet tým z pražské pobočky OracleLabs. Díky tomu to bude seminář praktický, přibližující nejnovější trendy ve vývoji virtuálních strojů. Žádná otázka nebude tabu - o GraalVM víme úplně vše!

Cílem bude ukázat si na výhody a zádrhele dynamického překladu. Pochopit, co překladač ve skutečnosti dělá a naučit se dorozumět se s ním - tedy programovat tak, abyste z dynamického překladu v GraalVM získali co nejvíce. Máte-li vlastní programovací jazyk, vezměte si jej s sebou - uděláme jej rychlejší!

A pokud to někoho bude opravdu bavit, tak může pokračovat v létě při studijní stáži v OracleLabs v Jinonicích.

Osnova přednášek

I. Představujeme nejrychlejší univerzální virtuální stroj

Záznam úvodní přednášky. Začínáme historií NetBeans, protože se k přednášce na MatFyzu určitě hodí. Nemůže chybět zmínka o návrhu API a mé knížce Practical API Design, aby bylo zřejmé, proč se tomuto kurzu říká Practical Dynamic Compilation! Následuje takové to tradiční povídání o tom, co GraalVM umí a jak je snadné a jednoduché to nainstalovat (pomocí utilitky gu), použít a jak strašně rychle pak lze počítat Eratesthénovo síto v libovolném jazyce. Není to nic převratného, ale pokud jste to ještě někdo neviděl, tak je to vhodná upoutávka k záznamům dalších lekcí.

Je naše GraalVM implementace Ruby 10-krát rychlejší než jakákoli jiná? Jak dlouho může trvat vypsat všechna prvočísla? Co je vstupem a co je výstupem Graal překladače? Jakým nástrojem můžeme zkoumat, co Graal překladač vlastně uvnitř dělá? Jak napsat vlastní jazyk? Jak vložit implementaci existujícího dynamického jazyka do vlastního Java programu? Dá se to potom také ladit? V NetBeans? Ve Chrome Dev Tools? Má cenu psát interpretr Céčka?

II. Jak fungují moderní překladače?

V záznamu druhé přednášky si nejprve dokončíme úvod z minula a povíme si, jak se zbavit Javovské virtuální mašiny! Dynamický překlad je skvělý, ale vyžaduje spoustu metadat. Naštěstí můžeme GraalVM využít na překlad Java kódu do EXáče! To je důležitý střípek v tom jak GraalVM ekosystém funguje. Ale protože nás primárně bude zajímat překlad dynamických jazyků, tak si hned také představíme základní trik, který z dynamických jazyků dělá něco, z čeho lze vygenerovat efektivní strojový kód. Pořádně to prodiskutujeme a pak...

Od 35-té minuty následuje skutečné povídání o moderních překladačích: Jak vlastně překládat Javu, Céčko a jiné staticky typované jazyky? Pro osvěžení, co to vlastně překladače jsou a jak fungují, nám výborně poslouží přednáška kolegy Chrise Seatona. Opravdu je lepší psát překladač v C++ než v Javě? Chcete psát překladač a nebo vás baví psát vlastní garbage collector!? Nevynalézejte znovu kolo a raději si vyklonujte graal repozitoř. Vaše oblíbené IDE (ať NetBeans nebo VSCode či Ideal Graph Visualizer a nebo i jiné) ty zdrojáky bez problémů otevře. Pak už můžete přidávat breakpointy do zdrojáků překladače, spouštět si vaše programy a koukat, jak se překládají. Můžete si i změnit sémantiku překladu, vypsat si ladící hlášky či něco podobného. Jak vaše aplikace, tak váš překladač jsou v Javě a ve vašem vývojovém prostředí se chovají úplně stejně. Avšak ne jen laděním je živ překládající inženýr! My milujeme grafy z překladače, které radostně zkoumáme v IGV. Stahujte, zkoumejte jednotlivé fáze překladu a bezostyšně přeskakujte mezi IR grafy různých fází, vašimi zdrojáky, zdrojáky překladače. Bez IGV ani ránu!

III. Jak překládají moderní překladače?

Třetí díl záznamu zahajuje pět minut technických problémů, ale pak již následuje vytvoření Maven projektu v IGV a jeho zkoumání ze všech možných úhlů. Použijte -Dgraal.Dump=:1 a -Dgraal.PrintGraph=Network a pojďme se podívat na grafy překladu. S gettery, které se inlinují či neinlinují. Prozkoumejme, jak vypadá IR graf výpočtu průměru. Se smyčkou či bez ní. Jak funguje bytecode parser? Jak se generuje assembler? Jak si můžeme vypsat strojový kód z příkazové řádky? Třída Phase a její implementace poskytují různé optimalizace: Kanonikalizace uzlů. Znovupoužití hodnot. Eliminace zámků. Jak může debugger spolupracovat s IGV? Přes graph.getDebug().forceDump(...). Tomáš Zezula nám představí GraphBuilderPluginy a dostane domácí úkol...

IV. Promluvte si s překladačem: Direktivy

Čtvrtá část záznamu zkoumá k čemu všemu lze Graal překladač vlastně použít. Začínáme ukázkou Tomáše Zezuly používající GraphBuilderPlugin k nahrazení SecurityManageru no-op konstantou (do 12-té minuty). Takže místo JEP-411, který se snaží SecurityManager smazat, bychom jej tam mohli nechat a jen eliminovat jakoukoli zátěž, která je s ním spojená, nepoužívá-li se. Zajímavé, že?

Propagace konstant je důležitá optimalizace, kterou budeme hojně používat při práci s Talk 2 Compiler demo projektem. A můžeme začít s Trufflem. Co je to RootNode.execute? Co je to CallTarget? To je způsob jak z Java módu běhu a překladu přeskočit do "Truffle překladu". Jak se liší Truffle IGV graf od klasického IGV grafu z Javy? Má final vliv v Javě? A má jej při Truffle překladu? Překlad pro "instanci" RootNodu. Lze používat CompilationFinal a měnit hodnotu takového políčka - natrénujte si svůj kód na hodnoty, které skutečně používáte. Dejte si ale pozor, ať ten kód natrénujete správně! Kdykoli měníte @CompilationFinal pole, tak nezapomeňte zavolat transferToInterpreterAndInvalidate()! Použijte TruffleBoundary na vyskočení z "Truffle módu" do "normální" Javy. Tím zabráníte inlinování příliš velkého množství kódu z mnoha metod.

V. Promluvte si s překladačem: Profily, bioinformatika a předpoklady

Opakování je matka moudrosti a tudíž pátá část záznamu stručně shrne specifika Truffle překladu a pak pokračuje ve vysvětlování různých dynamických optimalizačních triků. Spekulujme na to, že se nějaký parametr nemění. Trochu program natrénujeme a jen sledujeme, jak se vše zoptimalizuje. A abychom nemuseli pořád psát to samé, tak použijeme profily: ConditionProfile či ValueProfile či BranchProfile či createCountingProfile().

Ač tyto triky používáme primárně pro psaní interpretrů, tak jsou obecně užitečné. Pojďme se tedy mrknout, jak si promluvit s překladačem a zrychlit nějakou úlohu z bioinformatiky. Vezmeme si BooleanNetwork a zkusme ji nějak rychle prohledat. Když porovnáme klasickou (HotSpot) Javu a kód přeložený v Truffle módu, tak Truffle je o 20% rychlejší. Stačí použít direktivu @ExplodeLoop. Máte-li velké datové struktury, které chcete prohledávat, tak "částečné vyhodnocování" v Truffle módu, je přesně to, co byste měli prozkoumat!

Assumption (předpoklad) lze použít pro globální spekulaci. Díky tomu je možné přenastavením nějakého stavu zinvalidovat všechny již přeložené kódy, které na tomto stavu závisí. Nakonec si ještě zkusíme napsat polymorfní keš na prohledávání telefonního seznamu. Ale k tomu bude potřeba se ještě vrátit v příští lekci.

VI. Promluvte si s překladačem: Keše, abstraktní syntaktické stromy a DSL

Šestá část pokračuje zkoumáním keší. Jak kontrolovat velikost generovaného kódu? Co všechno do keše přidávat a kdy s tím již přestat? Mají se kešovat jen nenulové výsledky či i null hodnoty? Nakonec jsme se do toho opět trochu zamotali: problémem bylo, že jsme používali null pro dva významy - nenaplněnou keš a keš s neexistující hodnotou. Nakonec se to vyřešilo, ale je vidět, že udělat chybu nemusí být zase tak složité.

Od 13-té minuty se vrháme na syntaktické stromy. Vytvoříme tradičně košatý strom interpretru na sčítání čísílek z pole. Necháme to přeložit a hle, celá ta struktura zmizí a zbyde jen pár instrukcí strojového kódu. No čekali byste to? Což nás dostává k otázce, jaký je vztah či rozdíl mezi programem a daty? Je paměť příliš drahá na ukládání programů? Asi již ne, ale stále zde nějaký rozdíl je. Ve většině případů totiž lze spekulovat na to, že program se měnit nebude a že se budou měnit jen data. Což se také v Trufflu a jeho Node podtřídách dělá.

Co dál? Ve většině interpretrů se používá více datových typů. A dělat stále instanceof zpomaluje. Je třeba "přebarvit uzly" podle dat, které zpracovávají. Jde to dělat ručně, ale mnohem jednodušší je použít "Truffle DSL" - doménově specifický jazyk, který nás nechá psát, jen to důležité a většinu kódu dogeneruje. Základem tohoto jazyka jsou takzvané "specializace".

VII. Promluvte si s překladačem: Více DSL, práce s pamětí, kontrola běhu a knihovny

Sedmá část ukazuje jak definovat "typový systém" dynamického jazyka. Kontrolní otázka: Jaký asi je typový systém JavaScriptu? Ne, nedělám si legraci, něco takového vážně existuje!

Jak v dynamickém jazyku pracovat se zásobníkem? Používejte `VirtulaFrame` a specializace k ukládání lokálních proměnných. Chcete naimplementovat return? Vyhoďte ControlFlowException. Ten samý trik lze použít na break či continue a dokonce i na implementaci tail-rekurzivního volání.

Specializace (pevného seznamu) typů v každém nodu/uzlu? Neomezený seznam datových typů a ke každému umět získat jejich nody/uzly? Použijte knihovny! Což je kód: Library extends Node. Pojďme použít knihovnu jako "abstraktní datový typ" a nadefinujme si jednu popisující typ "pole". Pak už je jednoduché přidávat další a další implementace "pole".

Nakonec si ukážeme, jak opravdu zaregistrovat implementaci vašeho jazyka. Tedy podědit od TruffleLanguage a použít @Registration anotaci. Pak již lze používat obecné org.graalvm.polyglot API a komunikovat s naším jazykem, tak jako s každým jiným Trufflím jazykem.

VIII. Domluvte se mezi jazyky & vašimi datovými strukturami

Osmé pokračování našeho kurzu se věnuje interoperabilitě mezi jednotlivými Truffle jazyky. A nejen mezi jazyky. Také si ukážeme, jak vystavit vaši vlastní datovou strukturu a nechat ji efektivně zpracovávat pomocí libovolného Trufflího jazyka. Není to ani moc práce a funguje to skvěle a rychle. Hlavně si kvůli něčemu takovému nepište vlastní jazyk!

Posledních dvacet minut je pak věnováno dokončení povídání o správě paměti v dynamických jazycích. Garbage collector si vezmeme z Javy a pak už jen použijeme Shape/near classes/téměř třídy. Ty se pak stanou spíše součástí "kódu" nežli součástí dat.

IX. Štěpán Šindelář: Reimplementace skutečných jazyků

Devátého pokračování se ujal Štěpán Šindelář a rozhovořil se o tom, jak pomocí Trufflu naimplementovat Python' a Rko.

VIII. JIT vs. AOT překlad

Go, Java, go!
jargraal vs. libgraal
Using native-image to implement `native` methods

IX. Interop mezi jazyky

Messages. "Mounting" trees.
Exposing data structures to languages

X. Tools & Instruments

Making your language "toolable"
- Source section
- Tags
- Show how to debug in NetBeans
Writing an instrument
- Debugger, profiler, code coverage, language server protocol, NetBeans
node.js
- Mixing Java and JavaScript & co.

XI. Static Languages with LLVM

Sulong - interpret C, Rust, atd.
Truffle NFI

XII. Writing bytecode interpreter

Espresso - Java interpreter
Sulong - bitcode interpreter

XIII. Real Language Problems

implementace FFI jazyku jako Ruby/Python/R
yield in JavaScriptu
lazy evaluation in R

Appendix A: Contributing To Open Source

Overview of the repositories
Python, JavaScriptem, Ruby, FastR, Espresso
mx tooling
Signing OCA

https://github.com/jtulach/bf https://www.youtube.com/watch?v=FJY96_6Y3a4