Co się wydarzyło
Punktem wyjścia jest pochwała. Yash Patil (współzałożyciel i CEO firmy współpracującej z Harveyem) napisał na X, że Harvey świetnie buduje sobie pozycję przez „proprietary intelligence”, i podziękował za wspólną pracę nad benchmarkiem agenta prawnego. Pod spodem ktoś dopisał to, co wisiało w powietrzu: a co właściwie znaczy tu słowo „proprietary”? Czyja to inteligencja, skoro powstaje na danych i sprawach, które ktoś inny wniósł.
Will Chen, który buduje otwartą, suwerenną alternatywę dla takich narzędzi, wziął publiczną wypowiedź współzałożyciela Harveya o tym, że najbardziej wrażliwych, zastrzeżonych danych kancelarii (jego przykład: struktury prawne transakcji private equity) „nigdy nie da się wtrenować w publiczny model”, więc duże firmy i kancelarie „będą musiały zakodować swoją zastrzeżoną inteligencję prawną we własnych, zastrzeżonych modelach”. I wyciągnął z tego wniosek, którego sam autor wprost nie postawił.
Pracuj z kancelarią. Naucz się jej zastrzeżonej wiedzy i procesów. Potem sprzedaj to jej klientom.
Chen nazywa to świetną długoterminową strategią, która zabezpiecza dostawcę przed tym, że kancelarie zbudują własne narzędzia, „tylko niezbyt dobrą dla klientów Biglaw, którzy myślą krótkoterminowo”. Zaznaczmy uczciwie: to jego odczyt tego, co zostało zasugerowane, a nie ogłoszona strategia Harveya. Sam Chen pisze „jeśli Harvey robi to, co moim zdaniem mówi”. Cytowane wprost jest tylko zdanie o kodowaniu zastrzeżonej inteligencji we własnych modelach. Resztę dopowiada interpretacja.
Cichą część powiedziano na głos
Niezależnie od tego, czy Harvey faktycznie tak działa, sam model biznesowy opisany w tej wymianie wart jest dwóch minut namysłu, bo dotyczy każdego dostawcy AI uczącego się na pracy klienta. Mechanika jest prosta. Model uczy się tym lepiej, im więcej realnych spraw przez niego przejdzie. Realne sprawy wnosi kancelaria. Wartość, która z tego powstaje, zostaje w modelu dostawcy. A model dostawcy obsługuje też innych, w tym potencjalnie tych po drugiej stronie stołu.
Jest w tym pewna ironia, której nie trzeba podkręcać. Wypowiedź broniąca przewagi Harveya stała się, w odczycie Chena, jednym z lepszych argumentów za tym, żeby kancelaria budowała albo kontrolowała własny model. Dostawca, chwaląc swoją „proprietary intelligence”, podpowiedział klientowi, czyją właściwie inteligencję sprzedaje.
I druga obserwacja, mniej zabawna. W tym układzie kancelaria nie jest do końca klientem. Jest też nieodpłatnym działem badawczo-rozwojowym. Płaci abonament za to, żeby trenować narzędzie swoją wiedzą, a narzędzie jutro może usiąść po przeciwnej stronie negocjacji, u jej własnego klienta. Czy to problem, czy normalny koszt korzystania z dobrego softu, zależy od tego, kogo się pyta. I właśnie do tego dojdziemy.
Polski hak: to nie tylko poufność, to cel przetwarzania
Pod wymianą na LinkedIn włoski adwokat Marco Rossi postawił zarzut z perspektywy civil law: taki model jest „niemal nie do pogodzenia z surowym czytaniem tajemnicy zawodowej”, bo zamienia opłaconą przez klienta, uprzywilejowaną wiedzę w produkt dostawcy, i pyta, jak izba miałaby to pogodzić z poufnością i obowiązkiem niezależności adwokata. Trafne. Ale w polskiej i unijnej ramce można pójść o krok dalej, bo mamy narzędzie, którego dyskusja anglosaska nie używa.
Anglosaski spór toczy się o confidentiality i duty of independence. U nas dochodzi do tego ograniczenie celu z art. 5 ust. 1 lit. b RODO. Dane sprawy powierzono w jednym, konkretnym celu: prowadzenia tej sprawy dla tego klienta. „Nauczę się na tych danych, żeby udoskonalić produkt i sprzedać go innym” to inny cel, i to taki, którego klient zwykle nie obejmował zgodą ani umową. To podręcznikowy przykład przetwarzania w celu niezgodnym z pierwotnym, zanim w ogóle dojdziemy do tajemnicy.
Do tego warstwa, o której łatwo zapomnieć przy kuszącym demie: powierzenie przetwarzania z art. 28 RODO. Jeśli dane sprawy trafiają do dostawcy, który trenuje na nich swój model, to nie jest już tylko „narzędzie”, tylko podmiot przetwarzający, z umową powierzenia, lokalizacją danych i pytaniem o trening jako odrębne przetwarzanie. A nad tym wszystkim tajemnica zawodowa (art. 6 Prawa o adwokaturze, art. 3 ustawy o radcach prawnych) i niezależność, które nie znają wyjątku „bo model się uczył”.
Po angielsku to spór o poufność i niezależność. Po polsku to dodatkowo pytanie o cel przetwarzania: w jakim celu klient powierzył Ci te dane, i czy „douczenie cudzego modelu” mieści się w tym celu. Zwykle nie mieści.
Osąd zostawiamy Wam
Nie napiszemy tu, kto ma rację. Bo obie strony mają interes i obie mają argument. Will Chen sprzedaje suwerenną alternatywę, więc widzi w tym pułapkę, do której można nie wpaść. Dostawcy chwalący „proprietary intelligence” widzą zwykłą, legalną mechanikę dobrego produktu, który uczy się na danych. Marco Rossi widzi tajemnicę zawodową na kursie kolizyjnym. Każdy patrzy z miejsca, w którym stoi.
Zostawiamy więc kilka pytań, które polski prawnik może zadać sobie sam, zanim podpisze następną licencję. Czy model, którego używam, uczy się na moich sprawach. Czy umowa pozwala dostawcy wykorzystać tę naukę poza moją sprawą. W jakim celu klient powierzył mi te dane i czy ten cel obejmuje trening cudzego narzędzia. Czy wiedza, która jest moją przewagą, na pewno zostaje moja. I wreszcie: jeśli odpowiedzi mnie nie cieszą, czy istnieje wariant, w którym narzędzie pracuje, a dane i wiedza nie wychodzą poza kancelarię.
Dorzucimy tylko jedno, bo to fakt, nie ocena: wariant, w którym narzędzie pracuje, a wiedza zostaje, istnieje. Model uruchomiony lokalnie, na własnej maszynie, uczy się dla Ciebie, nie dla rynku. Czy wobec tego „proprietary intelligence” dostawcy to genialna strategia, czy konflikt w przebraniu produktu, nie rozstrzygniemy za Was. Osąd zostawiamy Wam.