Paweł Goleń, blog

Index robi różnicę

Od dość dawna używam prostego skryptu, który identyfikuje:

nowe pliki;
usunięte pliki;
zmodyfikowane pliki.

Głównie chodzi mi o wykrycie sytuacji, w której pliki na moim serwerze zmieniają się w sposób "nieoczekiwany" (malware, włamanie, dostęp z konta innych użytkowników hostingu). Samo porównanie wykonywane jest w sqlite.

Skrypt napisałem, sprawdziłem, że działa i potem po prostu używałem. Raz na jakiś czas wpadał mi jednak do głowy pomysł, by zrobić jego optymalizację. Nie jakąś dużą, po prostu zrobić indeksy na tabelach. I tak przez długi czas pomysł pozostawał w koszyku "może kiedyś", aż w końcu...

Przed:

_find_new_files: 24.0540001392
_find_deleted_files: 21.9730000496
_find_modified_files: 31.5250000954

Po:

_find_new_files: 0.0569999217987
_find_deleted_files: 0.050999879837
_find_modified_files: 0.0410001277924

Ups :)

Następny wpis: Cycript vs. Frida
Poprzedni wpis: Czy aby na pewno jesteś w stanie to wykorzystać?

Ślady

Brak Śladów

Komentarze

Może warto opublikować ten skrypt?

#1 jendras o 2015-10-18 17:50 (Odpowiedz)

też się pod tym podpisuje i przyłączam do prośby

#2 Seba o 2015-10-19 15:18 (Odpowiedz)

Niestety ten skrypt nie nadaje się do publikowania. Zrobiony został pod konkretną konfigurację i w innej będzie po prostu bezużyteczny.

#2.1 Paweł Goleń o 2015-10-21 07:04 (Odpowiedz)

Paweł a możesz powiedzieć trochę więcej o konfiguracji.
Co ile odpalasz taki skrypt?
Istnieją fajne systemy plików (ZFS) w których możesz zrobić snapshot całego fs i zrobić diffa pomiędzy dwoma snapshotami. ZFS wypiszę Ci konkretnie który pliki zostały zmodyfikowane.

#3 oshogbo (Strona) o 2015-10-21 15:43 (Odpowiedz)

Całość dotyczy hostingu, nad którym mam umiarkowaną kontrolę, więc nie mogę wybrać sobie systemu plików, nie mam również dostępu do poleceń, które dostarczyłyby mi informację o zmianach.

Podejście jest bardzo proste - po stronie serwera jest skrypt, który liczy sha256 dla każdego pliku w drzewie katalogów. Skrypt ten jest wywoływany przez klienta uruchamianego u mnie na stacji (ręcznie, jak mi się chce). Klient parsuje otrzymany plik (XML) i ładuje do bazy (sqlite). W bazie danych idą trzy proste zapytania:
1. Do znalezienia plików nowych (nie było, a są);
2. Do znalezienia plików usuniętych (były a nie ma);
3. Do znalezienia plików zmodyfikowanych (były, ale obecny hash jest inny niż poprzedni).

Te zapytania były robione przez JOIN po nazwie i dlatego założenie indeksów spowodowało taką dużą różnicę w czasie wykonania.

Tak, całość jest dość prosta do oszukania, ale celem tego ćwiczenia nie jest wykrycie jakiegoś APT, który próbuje się ukryć

#3.1 Paweł Goleń o 2015-10-21 19:16 (Odpowiedz)

Dodaj komentarz

Najnowsze wpisy

Jak powstaje elektrozłom: Sunday, 21 July 2024
Cluster: Monday, 15 July 2024
Sponsorem przebudowy placu zabaw jest...: Sunday, 30 June 2024
Po lewej stronie drogi: Sunday, 19 May 2024
Nie lubię, gdy jest płasko: Sunday, 18 February 2024
Nowy iPad - wrażenia z przesiadki: Wednesday, 24 January 2024
Jak nie wiesz, to nie wiesz: Sunday, 14 January 2024
Z microk8s na k3s: Wednesday, 8 November 2023
Rajesh Penetrator: Saturday, 2 September 2023
random(random()): Tuesday, 1 August 2023

Losowe wpisy

Archeologia: Sunday, 25 January 2015
(Prawie) każde szyfrowanie można złamać: Friday, 5 March 2010
Różnice między przeglądarkami: XMLHttpRequest: Wednesday, 21 April 2010
Jak udowodnić, że czegoś nie ma: Wednesday, 15 December 2010
O LiveCD: Sunday, 4 January 2009
Co jest nie tak z taką architekturą (Płatnik or compatible): Tuesday, 11 May 2010
Bo magic_quotes to nie wszystko: Sunday, 3 February 2008
O podejmowaniu decyzji: Saturday, 24 February 2007
Bootcamp II(c|d): Tuesday, 14 February 2012
Ciekawostka: uparty XSS: Friday, 14 May 2021

Paweł Goleń, blog

Zrzędzenie starego zgreda