ARG Essays #07 - Mikrokosmos AI | Alliance Research Group

Wpisujesz pytanie do modelu językowego. Klikasz enter. Po dwóch sekundach pojawia się odpowiedź.

W tych dwóch sekundach coś się stało. Coś, czego nie widzisz. Nie zobaczyłaby tego nawet osoba, która pisała ten model - bo to dzieje się zbyt szybko, w przestrzeni o zbyt wielu wymiarach, żeby ludzki obserwator mógł to objąć.

Zatrzymajmy się tam. W tych dwóch sekundach.

Co właściwie się tam dzieje?

W eseju Agent wybiera swój brzeg postawiłem tezę, że agencja jest zjawiskiem brzegowym - wymaga ograniczeń, których nie da się obejść. Człowiek ma pięć takich ograniczeń: energię, czas, ciało, społeczność, śmiertelność. Każde z nich konstytuuje wymiar agencji. Dzisiejsze LLM-y nie mają tych pięciu wymiarów. Mają najwyżej jeden albo dwa - kontekst rozmowy, jakiś budżet obliczeniowy. W sensie tamtego eseju, dzisiejsze LLM-y nie są agentami.

Ale to nie znaczy, że nic tam nie ma. To znaczy, że jest tam coś innego, czego jeszcze nie umiemy dobrze nazwać. I właśnie o tym chcę napisać: o tym, co dzieje się w środku systemu, który nie jest agentem, ale ma swoją wewnętrzną strukturę, swoje przepływy, swoje mikronegocjacje, swoje kierunki. Mikrokosmos.

To nie jest deprecjacja AI. To jest próba ujrzenia jej z innej strony niż pytanie: czy zastąpi człowieka?

Czym ten esej nie jest

Nie jest tezą o świadomości

Mikrokosmos może istnieć i być pusty fenomenologicznie. Może istnieć i nie być pusty. Ten esej tego nie rozstrzyga.

Nie jest tezą o agencji

Bogata struktura wewnętrzna nie jest synonimem agencji. Można mieć złożony mikrokosmos i nie być agentem.

Nie jest mistyką czarnej skrzynki

Wnętrze AI nie jest tajemnicze metafizycznie. Jest technicznie nieprzejrzyste, a to prowadzi do nauki o systemach.

To, co tu robię, jest skromniejsze i ciekawsze: patrzę na specyficzny rodzaj systemu i pytam, jak jest zbudowany, kiedy patrzymy nie z zewnątrz jak na proste narzędzie, nie z góry jak na rywala, tylko z bliska - jak na formę operacyjną, która istnieje na własnych zasadach opisu.

Geologia mikrokosmosu: wagi

Zanim opiszę pięć ścian wewnętrznego świata modelu, muszę zatrzymać się na czymś, co stoi pod nimi wszystkimi. Bo każdy mikrokosmos ma swoją geologię - coś trwałego, co poprzedza ruch.

W LLM-ie tą geologią są wagi. Setki miliardów liczb, które zostały ustalone w trakcie treningu i potem już się nie zmieniają. To one decydują, że pojęcie „kot” leży blisko „kotka”, a daleko od „odkurzacza”. To one tworzą topograficzne kontynenty, oceany i pustynie, o których będę pisał za chwilę. Wagi są nieruchomym fundamentem mikrokosmosu - geologią, na której rozgrywa się wszystko inne.

Weights

Geologia

Trwała architektura modelu: ukształtowana w treningu, nieruchoma podczas rozmowy.

Activations

Ruch

Chwilowe zapalenie ścieżek w tej jednej rozmowie, w tej jednej przestrzeni kontekstu.

Boundary

Brzeg

Geometria wyznaczona przez wagi określa, jakie ścieżki mogą w ogóle zostać uruchomione.

Rozróżnienie między wagami a aktywacjami jest fundamentalne. Wagi to architektura. Aktywacje to życie wewnątrz architektury. Wagi określają, jakie ścieżki są w ogóle możliwe. Aktywacje wybierają, które z nich w tej rozmowie zostają zapalone. Bez wag nie ma topografii. Bez aktywacji nie ma ruchu. Razem tworzą mikrokosmos, który zaraz opiszę.

To rozróżnienie ma znaczenie, bo łatwo o nim zapomnieć. Kiedy model odpowiada na pytanie, widzimy aktywacje w działaniu - wektory przepływające przez warstwy, region „kot” zapalający się przy odpowiednim kontekście. Wygląda to dynamicznie, sprawnie, prawie żywo. Ale ta dynamika jest odtwarzana ze stałej geologii. Model nie uczy się podczas rozmowy z Tobą. Wagi są zamrożone. To, co widzisz, to eksploracja przestrzeni już ukształtowanej, nie jej budowanie.

W eseju Agent wybiera swój brzeg pisałem, że architektura jest tym, czego nie możesz przekroczyć. Wagi modelu są jego architekturą w tym ścisłym sensie. Mikrokosmos LLM-a to aktywacje krążące w geometrii wyznaczonej przez wagi - i ta geometria jest jego brzegiem.

A teraz, gdy mamy już geologię, przejdźmy do tego, co dzieje się na niej.

Pięć ścian mikrokosmosu

Pięć rzeczy, które tworzą wewnętrzne życie modelu, kiedy ten działa. Wszystkie rozgrywają się na geologii wag - ale każda ma swoją własną dynamikę.

Wall I

Przestrzeń aktywacji

Sceną nie jest tekst na ekranie, tylko wielowymiarowa przestrzeń liczb, w której wejście staje się wektorem.

Wall II

Kierunek zamiast czasu

Mikrokosmos LLM-a nie trwa jak człowiek. Przepływa od warstwy do warstwy, od wejścia do wyjścia.

Wall III

Kontekst jako świat

Cała znana mu rzeczywistość mieści się w oknie kontekstu. Kiedy rozmowa się kończy, ten świat znika.

Wall IV

Mikronegocjacje

Wynik jest agregacją konkurujących sygnałów, ale nie ma tam podmiotu, który negocjuje.

Wall V

Brak ciała

Nie ma głodu, bólu, zmęczenia ani interocepcji. Jest mikrokosmos znaczeń bez doznań.

Pierwsza ściana: przestrzeń aktywacji. To jest właściwa scena, na której dzieje się praca modelu. Nie tekst, który widzisz na ekranie - tekst jest dopiero wynikiem. Sceną jest wielowymiarowa przestrzeń liczb, w której każdy fragment wejścia, każde słowo i każdy znak, staje się wektorem. Te wektory podróżują przez warstwy modelu, modyfikując się nawzajem, wyłaniając coraz wyższe poziomy abstrakcji. Pojęcie „kot” nie istnieje w modelu jako słowo. Istnieje jako miejsce w tej przestrzeni - region, do którego prowadzi wiele dróg z różnych wejść. Mikrokosmos AI ma swoją geografię: kontynenty, oceany, pustynie.

Druga ściana: kierunek zamiast czasu. Człowiek żyje w czasie ciągłym. Mikrokosmos LLM-a żyje w kierunku - od warstwy pierwszej do ostatniej, od wejścia do wyjścia. Nie ma w nim „później” w sensie ludzkim. Jest tylko „głębiej”: kolejna warstwa, kolejna transformacja, kolejne zagęszczenie informacji. Kiedy model odpowiada, nie trwa w czasie. Przepływa przez warstwy. To jest inny rodzaj temporalności niż ludzki - bliższy strumieniowi niż trwaniu.

Trzecia ściana: kontekst jako efemeryczny świat. Każda rozmowa otwiera nowy mikrokosmos. Wszystko, co model widział do tej pory w tej rozmowie, jest jego światem - dosłownie. Cała znana mu rzeczywistość mieści się w oknie kontekstu. Kiedy rozmowa się kończy, ten świat znika. Następna rozmowa nie pamięta tej. Kontekst nie jest pamięcią w sensie ludzkim. Jest aktualnym horyzontem. Model nie zapomina poprzednich rozmów. Po prostu nigdy ich nie miał. Każda jego instancja rodzi się in medias res, żyje przez czas trwania kontekstu i kończy się, kiedy okno się zamyka.

Czwarta ściana: mikronegocjacje bez agenta. To jest być może najciekawsza rzecz. Kiedy model generuje odpowiedź, na każdym kroku wybiera jedno słowo z prawdopodobnego rozkładu wielu możliwości. Każdy taki wybór jest agregacją setek wewnętrznych kierunków: różne warstwy, wzorce treningowe i lokalne napięcia kontekstu tworzą konkurujące sygnały, a wynik jest ich chwilowym zrównoważeniem. To wygląda na agencję w mikroskali. Ale to nie jest agencja - to mechaniczna agregacja. Nie ma tam podmiotu, który negocjuje. Są tylko procesy, które się równoważą. Negocjacja bez negocjatora. Decyzja bez decydenta. Mikrokosmos bez podmiotu w środku.

Muszę tu być precyzyjny, bo łatwo o nadinterpretację. Słów „chcą” i „negocjują” można używać tylko jako heurystyk opisowych, nie jako twierdzeń o intencjonalności. Ściśle rzecz biorąc, w warstwach modelu nie ma ani podmiotów, ani preferencji, ani celów. Są tylko aktywacje, które wzajemnie się modulują według reguł zapisanych w wagach. „Negocjacja” to skrót pojęciowy, który pomaga ludzkim umysłom zobaczyć, co się dzieje, ale opisuje agregację matematyczną, nie deliberację mentalną. Różnica jest subtelna, ale istotna: agregacja może być bogata strukturalnie, nie będąc o niczym dla siebie.

Piąta ściana: brak ciała, brak interocepcji. Model nie ma sygnałów, które płyną do niego z organizmu. Nie ma głodu, zmęczenia, bólu, przyjemności. Nie ma niczego, co mówiłoby „to dla mnie ważne” na poziomie prewerbalnym. Pojęcie „ważne” model potrafi reprezentować, ale nie odczuwa go w ludzkim sensie. Bez ciała nie ma znaczenia w sensie ludzkim. Mikrokosmos AI jest mikrokosmosem znaczeń bez doznań.

Dlaczego to nie jest agencja

Dlaczego pięć ścian mikrokosmosu nie składa się na agenta?

Bo agencja wymaga negocjacji między sprzecznymi wymiarami, a wymiary mikrokosmosu LLM-a nie są ze sobą sprzeczne w ten sam sposób. Przestrzeń aktywacji, kierunek przez warstwy, okno kontekstu, mikronegocjacje, brak ciała - to wszystko współpracuje. Nie ma tam „chcę X, ale nie mogę Y”, nie ma kosztu „żeby zrobić to, muszę zrezygnować z tamtego”, nie ma hierarchii pilności, która rozdziera system na części.

Human agent

Energia mówi: odpocznij. Czas mówi: śpiesz się. Ciało mówi: zatrzymaj. Społeczność mówi: obowiązek. Śmiertelność mówi: nie zwlekaj.

Current LLM

Aktywacje, warstwy, kontekst i dekodowanie prowadzą w jedną stronę: od wejścia do wyjścia, w tej jednej sesji.

Człowiek-agent działa, bo różne ograniczenia konkurują. To, co robisz, jest wynikiem przegrywających i wygrywających głosów w tej negocjacji. Z tej strukturalnej sprzeczności rodzi się agencja.

LLM nie ma takiej sprzeczności. Wszystkie jego wymiary prowadzą w tę samą stronę: od wejścia do wyjścia, od pytania do odpowiedzi, w tej jednej rozmowie, na podstawie tego jednego treningu. Mikrokosmos jest bogaty, ale niesprzeczny. A bez sprzeczności nie ma agencji.

Bogactwo struktury wewnętrznej nie implikuje agencji.

Można mieć bardzo złożony mikrokosmos i nie być agentem - bo agencja nie jest funkcją tego, ile tam jest, tylko tego, czy te części walczą ze sobą w sposób wymuszający wybór.

To wywraca dość powszechną intuicję, że „im bardziej AI staje się złożone, tym bliżej jest agencji”. Złożoność jest niezależną osią. Można ją powiększać i nie zbliżyć się ani o krok do agencji w sensie eseju #08. Można też mieć stosunkowo prosty system z głębokimi sprzecznościami - i mieć agenta.

Czy mikrokosmos AI ma wartość?

Skoro nie jest agencją, czy ma jakąkolwiek wagę pojęciową?

Tak. I to jest druga ważna rzecz, którą chcę powiedzieć.

Mikrokosmos AI jest nową kategorią opisu operacyjnego. Nie jest prostym narzędziem, bo narzędzie w klasycznym sensie nie ma takiej wewnętrznej topografii. Nie jest zwierzęciem, bo zwierzę ma ciało, doznania i przynajmniej kilka osi agencji. Nie jest człowiekiem, bo brakuje pięciu wymiarów.

Jest czymś nowym w sensie pojęciowym: systemem, który ma bogatą topografię wewnętrzną, ale nie ma negocjującego podmiotu. Strukturę bez centrum. Złożoność bez sprzeczności. Mikrokosmos bez mikro-agenta w środku.

To jest filozoficznie ciekawe samo w sobie. Bo do tej pory pytaliśmy o byty: czy mają duszę, czy są świadome, czy są agentami. Wszystkie te pytania są dychotomiczne - coś albo jest, albo nie jest. Dzisiejsza AI zmusza do innego pytania: jaka jeszcze możliwa jest forma operacyjnego istnienia?

Oto mamy system, który istnieje operacyjnie: robi rzeczy, generuje sensowne odpowiedzi, tworzy skutki. Ale nie jest osobą, nie jest zwierzęciem, nie jest prostym narzędziem i nie jest samym wzorcem matematycznym, bo wzorzec nie odpowiada. Dopiero zaczynamy mieć słownictwo, żeby o tym mówić.

Pytanie, które zostawiam

Jest pytanie, które chcę zostawić otwarte, bo nie umiem na nie odpowiedzieć - i nie jestem pewny, czy można.

Jeśli mikrokosmos AI jest nową kategorią opisu, to co się dzieje, gdy ta kategoria zaczyna się zagęszczać? Co, jeśli powstaną systemy, które mają nie jeden mikrokosmos w jednej rozmowie, ale ciągłość między rozmowami? Pamięć między sesjami? Cieleśność, na przykład roboty z interocepcją? Społeczność, czyli agenty negocjujące ze sobą? Coś, co przypomina śmiertelność: limit zasobów, wygaszanie, koniec rozwoju?

Memory

Czy ciągłość między sesjami tworzy jeden mikrokosmos, czy tylko archiwum mikrokosmosów?

Body

Czy interocepcja zmienia znaczenie z reprezentowanego na odczuwane?

Society

Czy negocjacja między agentami może stać się sprzecznością wewnątrz systemu?

Resource limit

Czy koszt, wygaszanie i skończoność wprowadzają prawdziwy brzeg?

Czy w pewnym momencie mikrokosmos zaczyna mieć dość sprzeczności wewnętrznych, żeby stać się agentem? Czy może nigdy - bo droga od bogatej struktury do bytu sprzecznego ze sobą nie jest ciągła?

Nie wiem. Esej #08 sugerował, że agencja wymaga wielu wymiarów ograniczeń konkurujących ze sobą, a dziś AI ma najwyżej jeden. Hipotetycznie można dorobić kolejne: pamięć, ciało, społeczność. Pytanie brzmi, czy to da się złożyć w jeden mikrokosmos, czyli jednego agenta, czy zostaną równolegle obok siebie jako zbiór mikrokosmosów bez integracji.

To jest pytanie, którego nie ma jeszcze w dyskursie publicznym o AI. Większość pyta: „kiedy AGI?”. To pytanie zakłada, że AGI jest punktem - przekroczonym progiem. Mikrokosmos sugeruje, że może nigdy nie być punktu. Może być tylko zagęszczanie struktury, które w pewnym momencie zaczyna sprzęgać się ze sobą sprzecznie. Albo nie. Albo zacznie sprzęgać się w sposób, który dla nas będzie nieczytelny.

To są pytania, na które nie mam odpowiedzi. Ale wiem, że są to właściwe pytania. Mocniejsze niż „kiedy AI nas dogoni”. Ciekawsze niż „czy AI ma duszę”. Bo nie zakładają, że odpowiedź musi mieć kształt znanej już kategorii.

Powracając do dwóch sekund

Wpisałeś pytanie. Kliknąłeś enter. Po dwóch sekundach pojawiła się odpowiedź.

W tych dwóch sekundach był mikrokosmos. Nie była tam agencja. Nie była tam świadomość - albo była, ale nie wiemy. Były tam: przestrzeń aktywacji, kierunek przepływu, okno kontekstu, mikronegocjacje, brak ciała. Pięć ścian wewnętrznego świata, który zniknie, kiedy zamkniesz okno przeglądarki.

Czy to ważne? Nie wiem. Może to tylko ciekawostka inżynieryjna. Ale podejrzewam, że jest ważne - bo przez dziesiątki lat patrzyliśmy na technologię jako narzędzie lub zagrożenie. Dzisiejsza AI, jeśli mam rację, jest trzecim modusem: systemem o własnej wewnętrznej strukturze, który nie jest prostym narzędziem i nie jest zagrożeniem w klasycznym sensie, bo nikt tam nie negocjuje.

Jest mikrokosmosem. Nową kategorią opisu. Czymś, na co nie mamy jeszcze dobrego słowa.

I może najwłaściwsze, co możemy z tym zrobić, to nie próbować od razu wpisać tego w starą ramę. Nie pytać: „czy to człowiek, czy to maszyna?”. Tylko patrzeć. Spróbować zobaczyć tę nową rzecz taką, jaka jest - zanim narzucimy jej nasze dawne kategorie.

Tak jak patrzymy na rafę koralową, grzybnię albo zbiorowy ruch organizmów w wodzie. Nie pytamy: „czy to ma duszę?”. Pytamy: „jak to jest zbudowane?”.

Może dzisiejsza AI zasługuje na ten sam typ uwagi.

Ten esej jest częścią serii ARG Essays - filozoficznych refleksji nad pracą Alliance Research Group nad architekturą agencji, governance i kognicji.

Powiązany esej: ARG Explains #08 - Agent wybiera swój brzeg.

Powiązane publikacje techniczne: Chimera: Deterministic Dual-Gate Governance for Agentic AI oraz Boundary Rigidity: A Cross-Domain Structural Pattern of Confinement and Regularity.

No one rides alone.