O czym był artykuł
Artykuł na LinkedIn opisał dwa repozytoria: mike i donna. Pierwsze to otwarta platforma legal AI, drugie - otwarty silnik orkiestracji delegowanych decyzji. Teza artykułu nie dotyczyła jednak konkretnych narzędzi, tylko postawy. Zamknięty SaaS dostajesz w jednej konfiguracji: cudzy model, cudza architektura danych, cudze domyślne ustawienia. Otwarty kod daje trzecią opcję między „kup gotowe" a „zbuduj od zera" - weź działającą bazę i ustaw ją pod swoją jurysdykcję i własną architekturę danych.
Między publikacją artykułu a tą aktualnością pojawił się trzeci projekt, który tę tezę ilustruje lepiej niż jakikolwiek komentarz: eumike. To nie nowe narzędzie zbudowane od zera. To mike rozebrany, przerobiony i złożony z powrotem - pod prawo Unii Europejskiej.
Trzy repozytoria
mike - otwarta platforma legal AI
willchen96/mike to platforma do pracy z dokumentami prawnymi: asystent, przegląd tabelaryczny, powtarzalne procesy pracy. Autor, Will Chen, to były prawnik Latham & Watkins; deklaruje, że mike ma rdzeń funkcji aplikacji webowej Harvey, a część zadań wykonuje lepiej. Repozytorium ruszyło 29 kwietnia 2026 roku i w ciągu trzech pierwszych dni przekroczyło tysiąc gwiazdek na GitHub. Na dzień 18 maja 2026 ma ponad trzy tysiące gwiazdek i około dziewięciuset forków. Licencja: AGPL-3.0. Architektura: Next.js, Express, Supabase, magazyn obiektów zgodny z Cloudflare R2. Można postawić instancję lokalnie - dokumenty zostają na infrastrukturze kancelarii.
donna - decyzja jako jednostka pracy
chiefofstaff-legal/donna rozwiązuje inny problem. Nie samo zadanie, tylko pracę dookoła zadania: układanie materiałów wejściowych, pilnowanie następnego kroku, przeklejanie między narzędziami. Prawnik mówi, co ma się stać, a donna rozdziela to do właściwej osoby i systemu. Każda delegowana decyzja jest zapisywana jako podpisany, odporny na manipulację rekord - kto zdecydował, na jakiej podstawie, z którym modelem AI, kiedy. Rdzeń to około dwustu linii Pythona z biblioteki standardowej, bez zależności zewnętrznych. Status: alfa. Repozytorium powstało 11 maja 2026 roku, licencja AGPL-3.0. To projekt młody i mały, ale architektonicznie ciekawy: stawia decyzję, nie dokument i nie czat, jako pierwszorzędny obiekt.
eumike - mike dopasowany pod prawo UE
lucianschw-dev/eumike to fork mike autorstwa Luciana Schwartza-Crofta, utworzony 16 maja 2026 roku. Autor nie jest programistą - to prawnik od prawa UE, z sześcioletnią praktyką w tej dziedzinie. Punkt wyjścia opisał w poście na LinkedIn: zapytany o orzecznictwo unijne, model AI potrafi zwrócić wyrok, który nie istnieje, albo - co gorsza - wyrok półprawdziwy, czyli poprawny numer sprawy przy zmyślonej tezie. Prawo UE jest dla modeli językowych trudne nie dlatego, że jest skomplikowane, tylko dlatego, że źródła są rozproszone: dwadzieścia cztery języki urzędowe, identyfikatory ECLI, tysiące mniej znanych wyroków, o których nikt nie napisał ani słowa.
Dokładka eumike jest konkretna: cztery narzędzia pobierające akty i orzecznictwo Unii Europejskiej na żywo z EUR-Lex, oficjalnej bazy prawa UE - wyszukiwanie po numerze CELEX, po sygnaturze ECLI dla orzeczeń Trybunału Sprawiedliwości, po adresie ELI oraz weryfikacja cytatów. Całość działa przez osobny serwer w standardzie Model Context Protocol, z obsługą wszystkich dwudziestu czterech języków urzędowych UE. Zamiast odpowiadać z pamięci, narzędzie pobiera tekst źródłowy i odpowiada z dokumentu.
Wart uwagi jest sposób, w jaki eumike zachowuje się pod niepewność. Autor pokazuje przykład: poproszony o streszczenie sprawy C-83/23, realnego, lecz mało znanego wyroku TSUE z 2024 roku, model nie zmyślił treści. Rozpisał na głos format identyfikatora, zaproponował kandydujący numer CELEX i zatrzymał się, żeby poprosić o potwierdzenie przed pobraniem dokumentu. To dokładnie ta postawa, której od narzędzia prawniczego się oczekuje: wie, czego nie wie, i pokazuje swoje rozumowanie. Sam autor nie obiecuje zbyt wiele - jak pisze, eumike „nie zastąpi Westlawa", ale „powstrzyma AI przed wymyślaniem orzecznictwa". Na wersję v0.1 to uczciwa deklaracja.
Liczby do zapamiętania
Trzy daty powstania mieszczą się w dwudziestu dniach. Tak gęsty kalendarz wynika z natury otwartego kodu. Gdy baza jest publiczna i audytowalna, adaptacja pod nową potrzebę przestaje być projektem na kwartał.
Trzyfilarowy filtr MateMatic
Wzorzec, nie konkretne repozytorium. Otwarty kod legal AI można przeczytać, sprawdzić, sforkować i postawić na własnej infrastrukturze. eumike jest dowodem, że dopasowanie jurysdykcyjne - tu: podpięcie EUR-Lex i orzecznictwa TSUE - da się zrobić w kilkanaście dni. Ten sam mechanizm da się powtórzyć pod orzecznictwo polskich sądów albo bazę ISAP. To działający wzorzec do podpatrzenia.
AGPL-3.0 to licencja copyleft z klauzulą sieciową - modyfikacje udostępniane przez sieć trzeba upubliczniać. Weryfikacja cytatów w eumike ogranicza halucynacje, ale ich nie eliminuje: model nadal może błędnie zinterpretować poprawnie pobrany tekst. Domyślna konfiguracja mike i eumike zakłada Supabase i magazyn zgodny z Cloudflare R2 - to dane w chmurze, a nie „zero-cloud" prosto z pudełka. donna jest w statusie alfa.
Bez audytu nie wdrażaj żadnego z tych repozytoriów produkcyjnie. Wdrożenie w kancelarii wymaga wcześniejszej oceny licencji, architektury danych i mapy ryzyka. Deklaracja „rdzeń funkcji Harvey" jest stanowiskiem autora, nie wynikiem niezależnego benchmarku.
Cztery linie polskiego compliance officera
Pierwsza linia: AGPL-3.0 to decyzja prawna, nie tylko techniczna. Jeśli kancelaria zmodyfikuje mike i udostępni go prawnikom przez przeglądarkę, klauzula sieciowa AGPL wymaga udostępnienia kodu źródłowego tych modyfikacji. Zanim ktokolwiek sklonuje repozytorium, licencję powinien przeczytać prawnik, nie tylko dział IT.
Druga linia: weryfikacja cytatów nie jest gwarancją. eumike pobiera akty z EUR-Lex po CELEX, ECLI i ELI. To ugruntowuje odpowiedź w realnym dokumencie, ale nie znosi ryzyka błędnej interpretacji pobranego tekstu. Ostatnie słowo co do treści orzeczenia ma prawnik, nie model.
Trzecia linia: „self-hostable" to nie to samo co „domyślnie self-hosted". mike i eumike w domyślnej konfiguracji zakładają Supabase i magazyn zgodny z Cloudflare R2. To powierzenie przetwarzania w rozumieniu artykułu 28 RODO i potencjalnie transfer poza EOG w rozumieniu artykułu 44 i kolejnych. Lokalne uruchomienie jest możliwe, ale wymaga świadomego przekonfigurowania.
Czwarta linia: tajemnica zawodowa zaczyna się przy konfiguracji. Otwarty kod pozwala postawić instancję w całości na infrastrukturze kancelarii i to realna przewaga nad zamkniętym SaaS. Ale dopiero konkretna konfiguracja - lokalna baza, lokalny magazyn plików, lokalny lub europejski model - decyduje, czy materiał objęty tajemnicą zawodową nie opuszcza kontroli kancelarii.
Trzy pytania, zanim sklonujesz repozytorium do kancelarii
- Czy zespół przeczytał AGPL-3.0 i rozumie klauzulę sieciową? Modyfikacja plus udostępnienie przez sieć równa się obowiązek publikacji kodu.
- Gdzie fizycznie wyląduje dokument klienta? Domyślnie materiał trafia do Supabase i magazynu R2. Bez przekonfigurowania to chmura, nie serwer kancelarii.
- Kto odpowiada za błędną interpretację pobranego orzeczenia? Ugruntowanie w EUR-Lex zmniejsza ryzyko zmyślenia sygnatury, ale nie zdejmuje odpowiedzialności z prawnika.
Otwarty kod daje kancelarii trzecią opcję między drogim, zamkniętym SaaS a budową narzędzia od zera - działającą bazę, którą można ustawić pod własną jurysdykcję i własną architekturę danych. eumike pokazuje, że takie dopasowanie jest kwestią kilkunastu dni pracy. Warunkiem nie jest budżet na licencję, tylko świadoma decyzja co do licencji AGPL, miejsca przechowywania danych i odpowiedzialności za treść.
Artykuł źródłowy o repozytoriach mike i donna: artykuł Wiesława Mazura na LinkedIn. Modularne, otwarte narzędzia legal AI w praktyce: aktualność Legal Data Hunter z 13 maja 2026. Launch Claude for the legal industry i polski layer regulacyjny: aktualność z 13 maja 2026. Co obowiązuje, co uzgodniono, a co jest mitem w AI Act: aktualność z 18 maja 2026.
Co MateMatic wnosi do tematu
MateMatic prowadzi audyt narzędzia AI dla kancelarii: ocenę otwartego repozytorium lub wtyczki pod kątem licencji, architektury przepływu danych oraz zgodności z RODO i tajemnicą zawodową, zanim narzędzie trafi do projektu klienckiego. Deliverable: jednostronicowa karta ryzyka narzędzia - typ licencji i jej konsekwencje, mapa „gdzie idą dane", lista decyzji do podjęcia przed wdrożeniem. Materiał osadzony w pillarach MateMatic Decyzja jako jednostka pracy i Stack zero-cloud.
Oceny w tej aktualności są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP.