Zarządzanie transakcjami w Java - jak to robić dobrze?

Czy ktokolwiek zamawiając w restauracji kawę i ciastka chciałby zapłacić za oba, a otrzymać tylko jedno? Czy do zaakceptowania byłby fakt, że po wysłaniu przelewu na pokaźną kwotę, uszczuplony zostałby jedynie nasz rachunek, a kwota nie zasiliłaby konta odbiorcy? Odpowiedzi na te pytania są oczywiste. Pewne rzeczy mają sens tylko wtedy, gdy wykonywane są kompleksowo. Podobnie jest z systemem zarządzania transakcjami w Javie, a podane przykłady świetnie ilustrują zależności, o jakich musimy pamiętać przy tym temacie.

W tym wpisie przedstawię krótkie wprowadzanie, ponieważ temat transakcji w programowaniu jest na tyle obszerny, że warto go podzielić na 2 części. W części pierwszej skupię się na przybliżeniu samej definicji oraz zasady działania transakcyjności w systemach baz danych oraz wykorzystaniu adnotacji @Transactional w Springu. Druga część poświęcona będzie problemom jakie napotkaliśmy w codziennej pracy, co pozwoliło je zidentyfikować oraz jak zostały wyeliminowane.

Transakcja

Pewien zbiór operacji, które muszą zostać wykonane kompleksowo (wszystkie lub żadna), nazywamy właśnie transakcją. Odniesienie do operacji bankowej o takiej samej nazwie jest nieprzypadkowe, a wspomniany już przykład przelewu jest modelowym wzorem transakcji. Wykonując przelew w banku pieniądze muszą jedocześnie zostać odjęte z rachunku nadawcy, jak i dodane w tej samej kwocie do salda konta odbiorcy. Tylko wtedy transakcja kończy się sukcesem.

W przypadku niepowodzenia, któregokolwiek z kroków, wykonane dotąd operacje muszą zostać cofnięte, a stan systemu przywrócony do chwili sprzed rozpoczęcia całej procedury.

Transakcje cechują się pewnym zbiorem zasad, określanych mianem ACID. Jest to akronim 4 właściwości (konkretnie ich angielskich nazw), którymi charaktryzuje się transakcja:

A (ang. atomicity) – atomowość – transakcja może zostać wykonana w całości albo anulowana. Jeżeli w trakcie wykonywania kroku objętego transakcją wystąpi problem, to wykonane zmiany powinny zostać cofnięte (rollback). Jeżeli wszystkie zakończone zostałyby sukcesem, to transakcja jest akceptowana (commit).
C (ang. consistency) – spójność – mówiąc potocznie oznacza, że „baza jest w dobrym stanie”. Powracając do przykładu przelewu, spójność oznaczałaby, że konto, z którego wysyłane są środki, pozwala na dokonanie operacji. Po zakończeniu transakcji stan konta nie może być ujemny. Spójność jest zatem pewnym zestawem reguł i zasad, których należy przestrzegać.
I (ang. isolation) – izolacja – właściwość, która odseparowuje od siebie operacje wykonywane jednocześnie tak, aby te nie miały na siebie wpływu. Chodzi np. o sytuację, gdy odwołujemy się do tej samej tabeli w bazie. Można też powiedzieć, że izolacja zapewnia, że w przypadku wykonywania operacji w sposób równoległy, baza danych pozostanie w takim stanie, jakby operacje te zostały wykonane sekwencyjnie.
D (ang. durability) – trwałość – gwarancja, że zaakceptowana transakcja nie zniknie niespodziewanie z systemu np. w przypadku awarii. Trwałość uzyskuje się poprzez zastosowanie mechanizmu replikacji, odnotowywania operacji w dzienniku logów czy poprzez zapis danych na dysku.

Poziomy izolacji

W praktyce wiele transakcji wykonywanych jest równolegle przez System Zarządzania Bazą Danych. Oznacza to często równloegły dostęp aplikacji do tych samych danych w bazie. Warto zatem wspomnieć o sposobie ustawiania blokad w dostępie do danych. Sposób ustawiania blokad określany jest mianem poziomu izolacji transakcji i pomaga w zachowaniu integralności danych. Poziomy izolacji określają zasady równoległej realizacji kilku transakcji.

System Zarządania Bazą Danych (SZBD) może np. zablokować wiersz tabeli, dopóki nie zostaną zatwierdzone aktualizacje. Efektem takiej blokady byłoby uniemożliwienie użytkownikowi uzyskania brudnego odczytu (ang. dirty read). Odczyt tego typu polega na dostępie do zaktualizowanej wartości, która nie została jeszcze zatwierdzona, i której istnieje możliwość przywrócenia do wartości poprzedniej.

Niepowtarzalny odczyt (ang. non-repeatable read) ma miejsce wtedy, gdy transakcja A pobiera wiersz, transakcja B go aktualizuje, a następnie transakcja A pobiera ten sam wiersz ponownie. W takim przypadku transakcja A pobiera dwa razy ten sam wiersz, ale widzi różne dane.

Odczyt fantomowy (ang. phantom read) to sytuacja, gdy transakcja A pobiera zbiór wierszy będących w danym stanie. Transakcja B następnie wstawia lub aktualizuje wiersz do tabeli. Następnie transakcja A ponownie odczytuję zbiór wierszy widząc tym razem nowy lub zaktualizowany wiersz, określany jako fantom.

Zgodnie ze standardem SQL-92 definiuje się 4 poziomy izolacji transakcji. Poniżej widzicie “efekty uboczne”, które są akceptowalne na danym poziomie, poczynając od najmniej restrykcyjnego:

Poziom izolacji	Brudne	Niepowtarzalne	Fantomowe
	odczyty	odczyty	odczyty
`READ_UNCOMMITTED`	Dozwolone	Dozwolone	Dozwolone
`READ_COMMITTED`	Uniemożliwione	Dozwolone	Dozwolone
`REPEATABLE_READ`	Uniemożliwione	Uniemożliwione	Dozwolone
`SERIALIZABLE`	Uniemożliwione	Uniemożliwione	Uniemożliwione

Należy pamiętać, że zastosowanie wyższego poziomu izolacji wiążę się ze spadkiem wydajności aplikacji. Poziomy izolacji pozwalają zatem na zachowanie równowagi między wydajnością, a wymaganą izolacją. Projektując aplikację trzeba pamiętać także o tym, że różne SZBD dostarczają różną liczbę poziomów izolacji. Dla przykładu w MySQL mamy 4 poziomy izolacji, podczas gdy w bazie Oracle poziomy izolacji są tylko 3.

Zarządzanie transakcjami w JDBC

Każdy, kto korzysta z mechanizmu transakcji w Springu wie, że pomocna w tym jest adnotacja @Transactional. Dzięki niej możemy zaoszczędzić trochę czasu, bo sami nie musimy implementować całego mechanizmu, którym zarządza framework. Warto jednak wiedzieć co dzieje się „pod maską”. Zobaczmy zatem jak wygląda uproszczone zarządzanie transakcją w JDBC, na którym zawsze bazujemy.

// nawiązanie połączenia z bazą danych
Connection connection = dataSource.getConnection();

try (connection) {
	// Po utworzenia połączenia z bazą, połaczenie to jest w trybie tzw. „automatycznego zatwierdzania”. Oznacza to, że każda pojedyncza instrukcja SQL jest traktowana jako jedna transakcja i jest automatycznie zatwierdzana zaraz po jej wykonaniu. Ustawienie flagi autoCommit na false pozwala na wykonanie więcej niż jednej instrukcji w ramach jednej transakcji.
	connection.setAutoCommit(false);

	// ...
	// operacje wchodzące w skład transakcji
	// ...

	// zatwierdzenie transakcji
	connection.commit(); 
} catch (SQLException e) {
	// wycofanie zmian w przypadku błędów 
	connection.rollback(); 
}

Punkty zapisu (ang. save points)

Oprócz operacji zatwierdzania transakcji (COMMIT) oraz jej wycofywania w przypadku niepowodzenia (ROLLBACK), istotna jest jeszcze jedna funkcja całego mechanizmu – punkty zapisu. Są to miejsca, do których nastąpi wycofanie transakcji, w przypadku awarii czy niepowodzenia. Posługując się fragmentem kodu, zastosowanie punktów zapisu, mogłoby wyglądać tak:

// ustawienie poziomu izolacji
connection.setTransactionIsolation(Connection.TRANSACTION_READ_UNCOMMITED);

// instrukcje wykonywane w ramach transakcji – część 1
// …

// ustawienie punktu zapisu 
Savepoint savepoint = connection.setSavepoint();

// instrukcje wykonywane w ramach transakcji – część 2 
// … 

// przywrócenie zmian do stanu z punktu zapisu
connection.rollback(savePoint);

Transakcje w Springu

O ile JDBC pozwala na zagregowanie wybranych instrukcji, jako odrębnych transakcji poprzez ręczne ustawienie flagi setAutocommit(false), o tyle Spring daje kilka sposobów osiągnięcia tego samego w znacznie wygodniejszy sposób.

Programowalne zarządzanie transakcją

Pierwsza, ale raczej rzadko wykorzystywana metoda to użycie TransactionTemplate albo PlatformTransactionManager. Sposób jej użycia wygląda następująco:

@Service
public class BookService {

	@Autowired
	private TransactionTemplate template;

	public Long addBook(Book book) {
		Long id = template.execute(status → {
			// dodaj książkę do bazy i zwróć wygenerowany identyfikator 
			// … 
			return id;
		});
	}
}

Zalety:

nie trzeba zaprzątać sobie głowy otwieraniem i zamykaniem połączenia z bazą danych poprzez stosowanie bloku try-catch-finally. Zamiast tego wykorzystywany jest mechanizm callbacków (Transaction Callbacks).
nie trzeba przechwytywać wyjątków SQLException, ponieważ Spring konwertuje je na wyjątki RuntimeException.
lepsza integracja z ekosystemem Springa. TransactionTemplate wykorzystuje TransactionManager do konfiguracji połączenie z bazą danych. Ich implementacja wiążę się z koniecznością utworzenia odpowiednich beanów, jednak później nie musimy się już martwić o zarządzanie nimi.

Deklaratywne zarządzanie transakcją

Spring daje też możliwość skorzystania z adnotacji @Transactional. Można ją umieścić zarówno nad definicją klasy, jak i publicznej metody. W pierwszym przypadku aplikacja zachowa się tak, jakby wszystkie publiczne metody wewnątrz klasy posiadały taką adnotację. Dzięki samej adnotacji, każda publiczna metoda, która zostanie oznaczona tą adnotacją, zostanie wykonana wewnątrz transakcji.

Mając już wiedzę w jaki sposób wygląda zarządzanie transakcją w JDBC, zobaczmy jak łatwo przekształcić kod tak, aby wykorzystywał dobrodziejstwo frameworka Spring:

Na początek spójrzmy ponownie na przykładowy kod z sekcji Programowalne zarządzanie transakcją i zobaczmy jak wyglądałoby dodanie nowej książki do bazy przy użyciu JDBC. Następnie przyjrzyjmy się użyciu adnotacji @Transactional w Springu:

public class BookService {
	@Transactional
	public Long addBook(Book book) {
		// dodaj książkę do bazy i zwróć wygenerowany identyfikator 
		// bookDao.save(book);
		return id;
	}
}

Wygląda znacznie prościej, prawda? Aby skorzystać z adnotacji @Transactional, konieczne jest jedynie zdefiniowanie menadżera transakcji w konfiguracji Spring’a oraz dodanie adnotacji @EnableTransactionManagement (w Spring Boot nie jest to konieczne).

@Configuration
@EnableTransactionManagement
public class MyConfig {

    @Bean
    public PlatformTransactionManager transactionManager() {
        return transactionManager;
    }
}

Jak działa adnotacja @Transactional

Spring pozwala na wykorzystanie usługi BookService w każdym innym beanie, który tego wymaga. Stosując adnotację @Transactional i odwołując się do metody, która jest nią opatrzona, Spring nie odwołuje się bezpośrednio do tej metody, ale tworzy tzw. proxy transakcyjne. Dzieje się to przy pomocy biblioteki Cglib i metody zwanej proxy-through-sublcassing. Zadaniem tego proxy jest zawsze:

otwieranie i zamykanie połączeń/transakcji z bazą danych
delegowanie zadania do rzeczywistej usługi, jak nasze BookService

Całą procedurę można zobrazować prostym diagramem:

Dodając adnotację @Transactional do naszej metody lub klasy, ale nie definiując ręcznie poziomu izolacji musimy zawsze pamiętać, że Spring ustawia ten poziom na domyślny. Co to oznacza? Otóż, w rezultacie, kiedy Spring tworzy transakcję, poziom izolacji będzie domyślną izolacją SZBD, z którego korzystamy. Niezwykle ważne jest zatem zachowanie ostrożności zarówno w momencie wyboru Systemu Zarządzania Bazą Danych, jak i jego późniejszej zmiany. Żeby samodzielnie określić poziom izolacji transakcji wystarczy wykorzystać atrybut adnotacji @Transational o nazwie isolation, np.:

    @Transactional(isolation = Isolation.REPEATABLE_READ)
    public void addBook() {
//      ...
    }

Poziomy propagacji (ang. propagation levels)

Spring pozwala na jeszcze jedną konfigurację mechanizmu zarządzania transakcjami. Daje bowiem możliwość ustawienia tzw. poziomów propagacji, które pozwalają niejako rozgraniczyć logikę biznesową w naszej aplikacji. Spring pozwala na wykorzystanie następujących rodzajów propagacji:

REQUIRED (domyślna) – Spring sprawdza czy istnieje aktywna transakcja, i jeżeli nie, tworzy ją. W przeciwnym razie logika biznesowa zostaje wykonana w ramach istniejącej transakcji.
SUPPORTS – Spring najpierw sprawdza czy istnieje aktywna transakcja. Jeżeli tak, wtedy jest ona wykorzystywana do wykonania logiki biznesowej, w przeciwnym razie logika wykonana jest poza transakcją.
MANDATORY – Podobnie, jak w przypadku SUPPORTS, Spring najpierw poszukuje aktywnej transakcji, i jeżeli ją znajdzie, to ją wykorzystuje. W przeciwnym razie rzucany jest wyjątek.
NEVER – Spring rzuca wyjątek w przypadku wykrycia aktywnej transakcji.
NOT_SUPPORTED – Jeżeli istenieje aktywna transakcja, Spring przerywa ją, a następnie logika biznesowa wykonywana jest poza transakcją.
REQUIRES_NEW – Podobnie, jak w przypadku NOT_SUPPORTED, Spring przerywa aktywną transakcję, lecz tym razem tworzy nową na potrzebę wykonania logiki biznesowej w odrębnej transakcji.
NESTED – Spring sprawdza czy istnieje aktywna transakcja. Jeżeli tak, to utworzony zostaje punkt zapisu. Oznacza to, że jeżeli wykonana następnie logika biznesowa zakończy się błędem, to stan systemu zostanie przywrócony do punktu zapisu. Jeżeli natomiast nie ma aktywnej transakcji, to system zachowa się tak, jak w przypadku REQUIRED.

Wybór metody zarządzania transakcjami w springu

Mając do dyspozycji dwie metody zarządzania transakcjami - programową i deklaratywną warto wiedzieć, kiedy stosować każdą z nich.

Programowe zarządzanie transakcjami:

pozwala na “zakodowanie” logiki transakcji między logiką biznesową
jest elastyczne, ale trudne w utrzymaniu z dużą ilością logiki biznesowej
preferowane, gdy stosowana jest względnie mała logika obsługi transakcji

Deklaratywne zarządzanie transakcjami:

pozwala na zarządzanie transakcjami poprzez konfigurację
oznacza oddzielenie logiki transakcji od logiki biznesowej
używa się adnotacji (lub XML) do zarządzania transakcjami
łatwe w utrzymaniu - boilerplate trzymany jest z dala od logiki biznesowej
preferowane podczas pracy z dużą ilością logiki obsługi transakcji

Pułapka

Na zakończenie warto wspomnieć o częstym błędzie popełnianym głównie na początku przygody z transakcjami. Zdarza się, że adnotacją @Transactional oznacza się powiązane ze sobą metody w tej samej klasie oczekując, że te wykonane zostaną w ramach odrębnych transakcji. W takim przypadku należy spojrzeć ponownie na powyższy diagram. Spring tworzy proxy transakcyjne, ale w momencie, gdy znajdziemy się już w rzeczywistym beanie BookService i wywołamy inne metody w nim zaimplementowane, żadne nowe proxy nie będzie zaangażowane w te operacje. Innymi słowy, nie zostanie rozpoczęta żadna nowa transakcja.

Spójrzmy na poniższy kod, który tworzy streszczenie wybranej książki, następnie zapisuje je w bazie i wysyła e-mail. Mimo oznaczenia obydwu metod adnotacją @Transactional, zgodnie z powyższym wyjaśnieniem, otwarta zostanie jedynie pojedyncza transakcja, nawet gdyby druga metoda jawnie wskazywała na konieczność utworzenia nowej transakcji poprzez ustawienie odpowiedniego poziomu propagacji.

@Controller
public class BookService {
    @Autowired
    private BookService bookService;
//  ...
}

@Service
public class BookService {
    @Transactional
    public void sendBookSummary() {
        createBookSummary();
        // zapisz streszczenie w bazie
        // wyślij streszczenie mailem, itd.
    }

    @Transactional(propagation = Propagation.REQUIRES_NEW)
    public void createBookSummary() {
        // ...
    }
}

Jak sobie z tym poradzić? Wystarczy np. odseparować logikę biznesową tworząc dodatkową warstwę i dedykowane serwisy.

@Service
public class BookService {
    
    private BookSummaryService bookSummaryService;
    private MailService mailService;
    
    public BookService(BookSummaryService bookSummaryService,
                       MailService mailService) {
        this.bookSummaryService = bookSummaryService;
        this.mailservice = mailService;
    }
    
    public void sendBookSummary() {
        bookSummaryService.createBookSummary();
        // zapisz streszczenie w bazie
        mailService.send();
        // itd.
    }
}

Mamy wtedy dedykowany serwis do tworzenia streszczenia książki:

@Service
public class BookSummaryService {
//  ... 
    
    @Transactional
    public void createBookSummary() {
        // ...
    }
}

I np. serwis odpowiedzialny za wysyłkę streszczenia mailem:

@Service
public class MailService {
//  ... 
    
    @Transactional
    public void send() {
        // wyślij streszczenie mailem
    }
}

Podsumowanie

Teoretyczne wprowadzenie do systemu zarządzania transakcjami w Javie już za nami! Na początku dowiedzieliśmy się czym w ogóle są transakcje, dlaczego są ważne i co je cechuje. Następnie przedstawiony został mechanizm działania transakcji w JDBC po to, by na koniec zaprezentować uproszczenie implementacji tego mechanizmu w Springu. W kolejnym artykule z tej serii dowiemy się jakie problemy napotkaliśmy wykorzystując mechanizm zarządzania transakcjami, jak udało się go zlokalizować oraz na czym polegała poprawka.