O czym jest to partnerstwo

Legal Data Hunter wystartował na początku 2026 roku jako open-source projekt na GitHub (repozytoria worldwidelaw/legal-sources i ZachLaik/legal-data-pipeline). Cytat założycielski z posta Laïka: "law worldwide belongs to everyone and an AI agent could somehow collect it into a single omni-jurisdictional database". Trzy miesiące później projekt ma 31 mln dokumentów w 160+ jurysdykcjach, 1100+ skryptów zbierających źródła publiczne, mapę pokrycia (frontend Leaflet.js + GeoJSON) i dashboard statusu źródeł per jurysdykcja.

Partnerstwo z Anthropic ogłoszone 12 maja 2026 dodaje LDH do connector marketplace Claude - obok 20+ pozostałych konektorów MCP wymienionych w blogu Claude for the legal industry (nasza pierwsza aktualność z 13 maja). W oficjalnym wykazie Anthropic LDH siedzi w kategorii Legal research, obok Midpage i Trellis. Plug-in nie wymaga konfiguracji custom MCP - user dodaje przez marketplace, autoryzuje, korzysta. Anthropic team kuratorujący partnerstwo: Mark Pike (ten sam, który koordynował Claude for legal industry), Hadley Mouritzen, Cameron Barnes.

Drugi sygnał wart zapamiętania. 31 mln dokumentów w 160+ jurysdykcjach to liczba, którą Anthropic w blogu Claude for the legal industry przypisuje pozycji "Legal research corpus" - dokładnie ta sama suma, którą Laïk podaje dla LDH. Free Law Project, też podpięty jako konektor, dostarcza osobno największy publiczny dataset US trial court. Dwa różne źródła, dwie komplementarne pokrywy - LDH globalna szerokość, Free Law Project głębokość US.

Liczby

Dokumenty zagregowane
31 mln
Pokryte jurysdykcje
160+
Skrypty OSS
1100+
Czas od pierwszego commitu
~3 miesiące
Średnia per jurysdykcja
~194 tys. dok.
Dostęp
claude.ai · Code · Cowork

31 mln dokumentów prawnych zagregowanych przez 1100+ skryptów open-source. 160+ jurysdykcji z mapą pokrycia (Leaflet + GeoJSON), z dashbordem statusu źródeł per kraj (complete / planned / blocked / requires maintenance). 3 miesiące od pierwszego commitu (data deklarowana przez założyciela) do partnerstwa z największym dostawcą frontier-modelu na rynku - benchmark tempa dla OSS w branży, w której Westlaw, LexisNexis i Wolters Kluwer budują korpusy od dekad. Status dystrybucji: dane przez status.json, repozytorium ZachLaik/LegalDataHunter publiczne, kod skryptów na GitHub pod worldwidelaw/legal-sources.

Trzyfilarowy filtr MateMatic

BIERZEMY

1100+ open-source skryptów jako zaproszenie do roli jurisdiction lead Polska - maintainerski tag "Become a Lead" jest na stronie LDH explicite. Kancelaria z głębokim know-how o krajowych źródłach (SAOS, ISAP, RCL, eKRS, MSiG, dziennikach urzędowych ministerstw) może objąć patronat nad polską jurysdykcją i kierować pokryciem od strony jakościowej, a nie tylko ilościowej. Realny ruch wolny od vendor lock-in - LDH pozostaje open source niezależnie od partnerstwa z Anthropic. Connector w marketplace Claude oznacza, że adoption w polskiej kancelarii nie wymaga budowy custom MCP - plugin Litigation Legal albo Privacy Legal z dzisiejszego launchu Anthropic może wywoływać LDH jako research backend, gdy prawnik pisze brief, bez wymiany DMS, bez integracji własnymi rękami. Tempo OSS jako sygnał kierunkowy - trzy miesiące od pustego repo do 31 mln dokumentów to konsekwencja konfiguracji projektu (skrypty modułowe per jurysdykcja, każda do osobnego forku, każda do osobnego pull requesta); dla polskiej kancelarii rozważającej własną mini-bazę wiedzy jest to konkretna mechanika do podpatrzenia - granularność per jurysdykcja i per typ źródła, nie monolityczny pipeline.

FLAGUJEMY

Polska jurysdykcja - status do sprawdzenia w status.json przed promowaniem klientowi. Strona LDH eksponuje mapę pokrycia z czterema stanami: complete, planned, blocked, requires maintenance. Jeżeli PL jest "planned" albo "blocked" - kancelaria nie ma dziś polskiego korpusu, ma deklarację. 31 mln to liczba globalna, nie deklaracja głębokości per jurysdykcja - 31 mln / 160+ = średnio ok. 194 tys. dokumentów per kraj, średnia myli; USA i UE prawdopodobnie ciężko, Polska może mieć dramatycznie mniej (do potwierdzenia w dashbordzie). LDH agreguje, nie waliduje - skrypty polegają na stabilności źródła zewnętrznego; gdy SAOS zmienia format, LDH ma stary snapshot, dopóki kontrybutor nie zaktualizuje skryptu (natura modelu OSS-aggregator, nie zarzut wobec projektu); konsekwencja: do pism procesowych zawsze weryfikacja bezpośrednio w oficjalnym źródle, LDH jako wstępny przegląd. Tajemnica zawodowa i prompt-flow - wyszukiwanie publicznego prawa to nie problem, ale jeżeli prawnik wpisuje do promptu fakty sprawy ("moja klientka X w sporze z Y o Z, znajdź podobne orzeczenia"), to leci nie tylko do Anthropic, lecz dodatkowo wywołuje konektor LDH z parametrami pochodzącymi z faktów klienta; każdy konektor MCP rozszerza powierzchnię, na której fakty klienta opuszczają środowisko kancelarii (interpretacja MateMatic, nie stanowisko NRA ani KRRP).

NIE ENDORSUJEMY

Tezy "31 mln dokumentów to globalne autorytatywne źródło dla prawnika" - LDH dostarcza ilość; jakość wymaga walidacji per jurysdykcja, per typ źródła (orzecznictwo / akty prawne / dzienniki urzędowe / interpretacje administracyjne), per granularność daty i wersji. Bez tej warstwy 31 mln jest sygnałem o skali projektu, nie deklaracją gotowości produkcyjnej w polskiej praktyce. Tezy "podpinamy LDH i kancelaria ma globalny research stack" - konektor LDH siedzi obok Westlaw, LexisNexis, CURIA, EUR-Lex i obok SAOS, ISAP, eKRS; nie zastępuje żadnego z nich. To dodatkowa warstwa wstępnego przeglądu, która działa najlepiej, gdy kancelaria ma już zaufane oficjalne źródła i wie, kiedy LDH wystarczy, a kiedy trzeba schodzić głębiej.

Partnerstwo LDH z Anthropic zmienia ekonomię research dla kancelarii - jeden konektor zamiast pięciu osobnych integracji. Nie zmienia jednak obowiązku weryfikacji każdej sygnatury i każdego fragmentu uzasadnienia w oficjalnym źródle, zanim trafi do pisma.

Cztery linie polskiego compliance officera

Pierwsza linia. RODO art. 28 i tajemnica zawodowa. Konektor LDH jest trzecim podmiotem w architekturze - obok kancelarii i Anthropic. Mimo że LDH przeszukuje publiczne prawo, parametry zapytań mogą zawierać dane klienta. DPA musi pokryć łańcuch: kancelaria → Anthropic → LDH. Sprawdzenie warunków LDH jako podmiotu dalej powierzającego przetwarzanie po stronie Anthropic jest obowiązkowe przed wdrożeniem (interpretacja MateMatic).

Druga linia. Walidacja pokrycia PL przed jakimkolwiek deploymentem na żywych sprawach. Konkretnie: pobierz dashboard statusu, zobacz, ile dokumentów jest indeksowanych z polskich źródeł, jakie źródła są oznaczone jako "complete" / "planned" / "blocked". Jeżeli kluczowy dla Twojej praktyki SAOS jest "planned" - dziś LDH nie szuka w polskim orzecznictwie, dziś LDH wyszukuje w 159 innych jurysdykcjach.

Trzecia linia. EU AI Act art. 26 - obowiązki wdrażającego. Plugin używający LDH jako research backend nie wpada w Annex III dopóki działa wspomagająco. Ale jeżeli automatyzujesz pipeline "pobierz orzecznictwo z LDH → wygeneruj draft uzasadnienia → wyślij do klienta bez review", przesuwasz się w stronę obowiązków deployera. Zachowaj Decyzja jako jednostka pracy - prawnik jako etap walidacji output research.

Czwarta linia. Citing orzeczeń z LDH w pismach procesowych. To pole, na którym KaBLE-podobne ryzyko (first-person false belief, Stanford HAI overlay z 9 maja 2026) nie znika, choć dotyczy innego typu błędu - tu chodzi o halucynację sygnatury orzeczenia albo fragmentu uzasadnienia. Reguła: każde cytowanie z LDH weryfikuj w oficjalnym źródle, zanim wejdzie do pisma.

Trzy pytania przed włączeniem konektora w kancelarii

  1. Jaki jest status polskich źródeł w LDH (SAOS, ISAP, eKRS, MSiG, dzienniki urzędowe)? Sprawdź status.json i dashboard. Jeżeli "planned" lub "blocked" - LDH dziś nie jest pierwszym narzędziem dla polskiej praktyki, jest opcją dla spraw transgranicznych.
  2. Czy kancelaria chce objąć rolę jurisdiction lead PL? To pozycja maintainera dla polskiej jurysdykcji - widoczność w globalnym projekcie OSS, wpływ na priorytet pokrycia źródeł, obecność w międzynarodowym projekcie LegalTech. Koszt: czas seniora technicznego plus prawnik nadzorujący jakość źródeł.
  3. Czy regulamin promptingu w kancelarii zakazuje wprowadzania faktów klienta do zapytań research? Konektor LDH dodaje powierzchnię, na której takie zapytania wychodzą poza kancelarię. Jeżeli zasady nie ma - LDH ją wymusza.
Powiązane materiały MateMatic

Anthropic launchuje Claude for the legal industry: aktualność z 13 maja 2026 (LDH w wykazie 20+ konektorów MCP, kategoria Legal research). Stanford HAI LegalTech overlay: aktualność z 9 maja 2026 (KaBLE benchmark - ryzyko halucynacji w cytowaniu orzecznictwa). Polski LegalTech mapa AI: aktualność z 27 kwietnia 2026. AI Firm Index Matta Pollinsa: aktualność z 5 maja 2026.

Dla zarządu kancelarii w trzech zdaniach

Legal Data Hunter w connector marketplace Anthropic daje polskiej kancelarii dostęp do globalnego wstępnego przeglądu prawa bez integracji własnymi rękami - i jednocześnie zaprasza do roli jurisdiction lead PL, której objęcie ma sens dla kancelarii inwestującej w obecność w międzynarodowych projektach LegalTech. Pierwszy krok operacyjny: dziś sprawdź status polskich źródeł w dashbordzie LDH, zanim klienci usłyszą "podpinamy LDH". Drugi: zdecyduj, czy polskie pokrycie jest dla Was projektem do współzarządzania, czy tylko opcją do śledzenia.

Co MateMatic wnosi do tematu

Warsztat MateMatic "Walidacja stack-u AI kancelarii na własnym korpusie" w nowej edycji uwzględnia LDH jako baseline research backend obok lokalnych źródeł (SAOS, ISAP, eKRS). Audyt pokrycia LDH dla polskich źródeł (które publiczne źródła są dziś indeksowane, jakie luki), test 30-50 zapytań research wzorowanych na realnych zadaniach kancelarii, mapowanie LDH na pillar Decyzja jako jednostka pracy z eksplicite zapisaną regułą weryfikacji w oficjalnym źródle. Plus opcjonalny moduł Jurisdiction lead PL dla kancelarii, które chcą objąć tę pozycję - mapa zadań, harmonogram, wymagania techniczne (Python skrypty modułowe), wymagania jakościowe (walidacja prawna źródeł).

Interpretacje regulacyjne są stanowiskiem MateMatic, nie zastępują doradztwa prawnego i nie stanowią stanowiska NRA ani KRRP.