Paweł Goleń, blog

Wyobraź sobie taką sytuację – masz współpracownika, któremu ufasz. Ale z czasem zaczynasz się zastanawiać, czy aby przypadkiem nie jest przypadkiem Koreańczykiem, tym z północy. Cóż zrobić?

Rozwiązanie jest banalnie proste, wystarczy poddać taką osobę testowi Stroopa... ...tak, wiem. Tak naprawdę opowieści o wykorzystaniu tego konkretnego testu do demaskowania szpiegów mają bardziej anegdotyczny charakter, ale użyłem tego przykładu celowo, bo ostatnio okazało się, że LLM też mają problem z tym testem, patrz Stroop Test Exposes Inherent LLM Flaw.

Zbliżając się do sedna – ostatnio uczestniczyłem w dyskusji odnośnie projektowania toola udostępnianego przez MCP dla agenta. Tool miał za zadanie pozwolić agentowi wykonywać potrzebne operacje, ale jednocześnie zablokować możliwość wycieku danych. Na pierwszy rzut oka rozwiązanie było poprawne, szczegóły danych nigdy nie były ujawniane agentowi, tylko pewne statystyki, które agent potrzebował do analizy wydajności. Problem rozwiązany?

Nie do końca. Narzędzie to, z uwagi na swoje przeznaczenie, nadal miało kilka subtelnych side channels pozwalających na wnioskowanie o danych, czyli efektywnie – wyciek danych nadal był możliwy. Co więcej, obecne LLM bez trudu były w stanie zidentyfikować ten scenariusz na podstawie opisu narzędzia (co przyjmuje na wejściu i co robi). Ups.

I teraz naprawdę korci mnie, by przetestować ten case w Agentic Misalignment: How LLMs could be insider threats.

Autor: Paweł Goleń

Moje Pi 5 doczekało się czapki. A konkretnie M.2 HAT+ Compact, oczywiście z dyskiem SSD.

Dlaczego? Z kilku powodów:

  • Postanowiłem uniezależnić się od NAS w runtime
  • Dysk SSD podłączany przez USB3 powodował zakłócenia zigbee
  • Po podłączeniu przez USB2 zakłóceń nie było, ale pojawiło sie ”gubienie” dysku pod większym obciążeniem (sporadyczne, ale irytujące)

Przy okazji zamontowałem w obudowie wentylator, bo chłodzenie pasywne przestało wystarczać po dodaniu kolejnego źródła ciepła (dysk SSD).

Po tych zmianach kultura pracy i mój komfort (również psychiczny) uległ wyraźnej poprawie.

Sponsorem całego zamieszania są sporadyczne przerwy w dostawie prądu, przez które o kilka razy za dużo musiałem wykonywać naprawę baz danych. Zawsze skuteczną, ale jednocześnie zawsze irytującą.

Tak, większość pracy tak naprawdę wykonał Claude.

Autor: Paweł Goleń

Nie, nie przyzwyczaiłem się do używania słów i związków frazeologicznych w sposób niezgodny z ich przeznaczeniem. Dalej irytuje mnie brak zrozumienia, że “ignorancja” to nie to samo, co “ignorowanie”. Irytują mnie tytuły o tym, jak to “Internet wrze”, a ktoś “grzmi”.

Od pewnego czasu widzę nową tendencje do zaczynania tytułu od “klasy nie kupisz”. Nie mam czasu i ochoty czytać każdy z tak zatytułowanych artykułów, ale kilka losowo wybranych pokazuje, że osoba, która tej klasy miała nie kupić zachowała się właśnie w sposób klasę potwierdzający.

Cóż, dla przypomnienia – to powiedzenie oznacza, że dobrego wychowania czy stylu bycia nie kupi się za pieniądze...

Autor: Paweł Goleń

Higiena snu jest ważna, staram się by mój sen był regularny. Nie jestem osobą, która śpi długo, dziennie jest to między 6 i 7 godzin. Przede wszystkim staram się utrzymywać określony, stały rytm snu.

Czytaj dalej...

Airbus 380 leci przez Atlantyk. Leci ze stałą prędkością 800 km/h na wysokości 30 000 stóp, gdy nagle pojawia się Myśliwiec Eurofighter z prędkością Mach 2. (…)

  • zasięg Typhon Eurofighter nie pozwala na swobodny przelot nad Atlantykiem, oraz
  • Mach 2 jest prędkością maksymalną, prędkość przelotowa (bez uzbrojenia) to 1.5 Ma.

Wnioski?

  • tak, jestem inny;
  • bajdurzyć też trzeba umieć.

A na poważnie – ja wiem, że historie mają moc. Umiejętne opowiadanie historii pozwala osiągnąć wiele.

Jednocześnie warto uważać, by nie posunąć się zbyt daleko, tak jak w przypadku tego nieszczęśliwego trzmiela, który nie powinien latać, a lata.

Autor: Paweł Goleń

Do tej pory byłem szczęśliwym posiadaczem trzech komputerów jednopłytkowych: – Raspberry Pi Zero W – Raspberry Pi 3B+ – Odroid C4

Czytaj dalej...

Właśnie dobiegł końca urlop we Włoszech. Urlop udany, spędzony w dwóch miejscach, najpierw w okolicach Suvereto, a następnie okolicach Montelupo Fiorentino. W obu przypadkach nocleg w „agroturismo” i takie rozwiązanie sprawdziło się doskonale.

Czytaj dalej...

Wiele lat temu pojawiła się książka Mity Bezpieczeństwa IT i tak sobie myślę, że w 2025 roku chętnie dodałbym do listy te dwie rzeczy:

  • nie używaj niezaufanych sieci WiFi
  • korzystaj z VPN.

Te dwa punkty może nie są kompletnie nieprawdziwe, natomiast “Zna proporcją, mocium panie”.

Czytaj dalej...

Właście tytuł powinien brzmieć “jak zastrzegłem sobie kartę?!” i wyrażać zdziwienie i zaskoczenie.

W skrócie – udało mi się dzisiaj przypadkowo zastrzec (efektywnie – unieważnić) kartę kredytową.

Jak? W aplikacji mobilnej przez przypadkową aktywację opcji, niespodzianka, “Zastrzeż kartę”. Opcję wywołałem przez przypadek, gdy telefon wyślizgnął mi się z dłoni. Najwyraźniej nie tylko udało mi się w ten sposób rozpocząć proces, ale również chęć zastrzeżenia karty potwierdzić i cały proces pomyślnie ukończyć.

Teraz mam pewne wątpliwości. Tak, zastrzeganie karty powinno być proste, by w przypadku, gdy będzie taka potrzeba nie trzeba było spędzić 3 godzin szukając instrukcji. Ale możliwość zastrzeżenia karty przez zdarzenie podobne do butt call to chyba jednak przesada, dodanie kroku autoryzacji, podobnego do tego wymaganego przy przelewie, nie utrudniałoby procesu zastrzeżenia karty, a teoretycznie ograniczyłoby możliwość przypadkowej akcji.

Autor: Paweł Goleń

Jak prawdopodobnie słyszeliście, 23andMe złożyła wniosek o bankructwo. Co z tego wynika?

Czytaj dalej...