Jeżeli nasza aplikacja pracuje pod dużym obciążeniem odpowiednie zoptymalizowanie jej jest kluczowe.

W tym artykule chciałbym zaprezentować różne często popełniane błędy w podejściu do pisania aplikacji w języku PHP a także sztuczki i propozycje, które poprawiają wydajność. Postaram się pokazać jak różne niewydajne elementy zastąpić elementami wydajnymi. Niektóre zabiegi są naprawdę bardzo proste a poprawiają wydajność aplikacji nawet kilkukrotnie (oczywiście w skali makro). Aby zobaczyć różnicę w wydajności będę konkretne operacje powtarzał w pętli po 100 lub 1000 razy, żeby uzbierał się odpowiedni czas na testowanie. Pozwoli to odwzorować przeciętne obciążenie strony.

Maszyna testowa:

Procesor: P4 3,2 GHz (s478 Northwood)
Pamięć: 2 GB DDR Dual (Kingston)
Dysk: 2x 60GB WD (Raid 0, SATA)
Płyta: Abit IC-7g

Windows Vista, XAMPP (PHP 5.3)

Elementy obciążające PHP

Przygotowuje sobie w międzyczasie implementację ActiveRecord do środowiska Prime. Jednym z elementów założenia jest zwrócenie listy obiektów (aktywnych rekordów), z których każdy posiada zestaw wartości (kolumny wiersza) oraz metody. W zasadzie jest instancją takiego samego obiektu jak element potomny.

zwykłe wykonanie kodu, który za pomocą PDO, wykonuje zapytanie do bazy i zwraca po prostu tablicę z wynikami przy 1000 wywołaniach:

Mniej więcej wygląda to tak:

	public function select($where = null, $args = array()) {

		$sql = 'SELECT ' . $this->_columns . ' FROM ' . $this->_table;

		if ($where) {
			$sql .= ' WHERE ' . $where;
		}

		$data = array();

		$stmt = $this->_dbh->prepare($sql);

		foreach($args as $k => $v) {
			$stmt->bindValue($k+1, $v);
		}

		$stmt->execute();

		while ($row = $stmt->fetch(PDO::FETCH_OBJ)) {
			$data[] = $row;
		}

		$stmt->closeCursor();

		return $data;
	}

I teraz test:

$Test = new Test();
for($i=1;$i<1000;$i++)
	$a = $Test->select();

Jak widać. Klasa wykonuje odpala zapytanie 1000 razy i zwraca obiekt z wynikami. Obiekt PDO typu FETCH_OBJ

To daje średni czas: 0,688 sekundy

Problem zaczyna się gdy zwrócona lista nie ma być zwykłą listą wyników lecz listą obiektów tej klasy. Przedstawia się to mniej więcej tak

public function findAll($conditions = '', $arguments = array(), $order = '', $limit = '')
 	{
		$add = null;

		if (strlen($order) > 0)
 			$add .= ' order by '.$order;

		if (strlen($limit) > 0)
 			$add .= ' limit '.$limit;

		$rows = $this->_select($conditions, $arguments, $add);

		$classname = get_class($this);
 		$retval = array();

		foreach($rows as $row) {
			$obj = new $classname();
 			$obj->loadFromArray($row);
 			$retval[] = $obj;
		}

 		return $retval;
 	}

I test:

$Test = new Test();
for($i=1;$i<1000;$i++)
	$a = $Test->findAll();

W takim oto zestawieniu czas wynosi średnio: 5,1265 sekundy

Ups! Chyba trochę za dużo. Zaczęły się więc poszukiwania “wąskiego gardła”. Jak widać, w pętli metody findAll tworzy się za każdym razem obiekt tej samej klasy (żeby rezultat był active recordem) Dotarłem więc do konstruktora, którzy wygląda tak:

	public function init($classname, $conditions = '', $order = '')
 	{
 		if (isset($this))
 			$obj = &$this;
 		else
 			$obj = new $classname();

 		if ($obj->table == '')
 			$obj->table = strtolower($classname);

 		if ($obj->data === false)
			$obj->clear();

		require_once 'Database.php';
		$this->_dbh = Database::getInstance();
 	}

Mamy tu jedną bardzo istotną rzecz: “require_once”. Każdy programista PHP wie do czego ta instrukcja służy ale jednak jak widać nie zawsze wiadomo jak właściwie ją zastosować. “_once” zapewnia nam, że ponowne wywołanie tej instrukcji już się nie wykona jeśli wykonało się wcześniej. Jeśli napisałbym “require” to za każdym razem require tego pliku by się wykonywał. Jakie to ma znaczenie dla aplikacji?

W sieci można znaleźć wiele testów mających na celu wykazanie wyższości jednego nad drugim, jednakże wiele z tego zależy od użytych systemów dodatkowych takich jak APC, systemu operacyjnego, sprzętu, buforowania dysku i pamięci podręcznej, itd – takie testy nie są zbyt pomocne jeśli nie można do końca przewidzieć środowiska którym aplikacja będzie pracować. Teoretycznie, “require” czy też “include” powinny być szybsze od swoich odpowiedników “_once”, ale trzeba wziąć pod uwagę ich zastosowanie.

Jeżeli taki test przeprowadzony jest wewnątrz aplikacji (tak jak u mnie), to “require” przegrywa na całej linii: Dla porównania:

1000x wykonany require_once: 3,423 sekundy
1000x wykonany require 6,356 sekundy

Jednak trzeba na problem spojrzeć z innej strony. W takim przypadku warto stosować zawsze funkcje “_once” gdyż:

  1. Działa ona szybciej gdyż nie wykonuje ponownie załączonego kodu
  2. Zapewnia, że aplikacja nie wyłoży się w momencie załadowania pliku jeszcze raz (bo się po prostu drugi raz nie załaduje – będzie już rezydowała w pamięci dla danego czasu życia aplikacji)

Gdy jednak spojrzy się na to pod względem testu całej aplikacji, tzn “1000x żądanie odpyta się skrypt” a nie “1000x skrypt odpyta plik” to wtedy warto zastosować “require” gdyż jest szybsze. Dokładniej przedstawić takie scenariusze:

  1. 1000 użytkowników -> request -> skrypt (załączenie pliku “A.php”)
  2. 1 użytkownik -> request -> skrypt (1000x załączenie pliku A)
  3. 1 użytkownik -> request -> skrypt (załadowanie 1000 różnych plików)

Jak należy postąpić w przypadku w/w scenariuszy?

1) Jeżeli pojawi się wiele requestów skryptu, który załącza sobie podelementy samego siebie ale tylko RAZ (np jakieś klasy do obsługi bazy, do obsługi wyjątków itd, i robi to tylko raz w ciągu działania aplikacji – użyj “require

2) Jeżeli jeden użytkownik uruchomi skrypt, który gdzieś ma 1000x załączenie tego samego pliku, użyj “require_once

3) Jeżeli jeden użytkownik uruchomi skrypt, który gdzieś ma załączenie 1000 różnych plików użyj “require” (jeśli robi to tylko raz, lub “require_once” jeśli robi to wiele razy)

Wszystko to sprowadza się do bardzo prostej konkluzji, która mówi, że używanie funkcji “require” jest jak widać dosyć czasochłonne, więc należałoby to robić jak najrzadziej.

Omawianą klasę do obsługi ActiveRecord wystarczy więc przerobić tak, aby nie robiła “require” za każdym razem gdyż jest to niepotrzebne. Jeżeli w swojej aplikacji przewidujesz, że ta klasa będzie używana w 99% przypadków to załącz ją do “rdzenia”

Zatem, gdy usunę tylko ten require z konstruktora, co prezentuje się tak:

	public function init($classname, $conditions = '', $order = '')
 	{
 		if (isset($this))
 			$obj = &$this;
 		else
 			$obj = new $classname();

 		if ($obj->table == '')
 			$obj->table = strtolower($classname);

 		if ($obj->data === false)
			$obj->clear();

		$this->_dbh = Database::getInstance();
 	}

Wynik testu zmienia się na: 0,913 sekundy

Przed zmianą było to: 5,1265 sekundy

A więc widać, że znaczący miało to wpływ.

Poprawianie wydajności

Udało nam się poprawić czas. Podstawowe zwrócenie wyniku przez PDO przypomnę, że było to: 0,688 sekundy

Zwrócenie obiektu danej klasy zdecydowanie opóźniło czas, ale dzięki różnym zabiegom udało się zejść z 5,1265 sekundy do 0,913 sekundy

Ale czy da się zrobić coś więcej? Tak.

Zacytuję jeszcze linijkę:

foreach($rows as $row) {
			$obj = new $classname();
 			$obj->loadFromArray($row);
 			$retval[] = $obj;
		}

Chcemy zwrócić tablice activerecordów, które są de facto obiektamy tej samej klasy. Po co jednak za każdym razem tworzyć nowy obiekt? Czy nie lepiej byłoby skopiować go i podmienić tylko wartości? Tutaj z pomocą przychodzi nam polecenie “clone“. Clone tworzy nam dokładną kopię danego obiektu jednak w postaci zupełnie osobnej, niezależnej instancji. Tworzy się dokładna kopia takiego obiektu i możemy na nim pracować zupełnie niezależnie – ale dzięki temu nie musimy tworzyć całej klasy od nowa, uruchamiać konstruktorów itd itd. Jak to wpływa na wydajność? Gdy zastąpimy tworzenie obiektu klonowaniem:

foreach($rows as $row) {
			$obj = clone $this;
 			$obj->loadFromArray($row);
 			$retval[] = $obj;
		}

Czas wykonania skryptu spada do: 0,804 sekundy

Nieźle? Praktycznie dotarliśmy do wyniku klasy, która robi tylko zwykłe zapytanie. Tak naprawdę w tym momencie nie musimy się już przejmować optymalizacją funkcji w klasie gdyż obciążenie będzie już wynikało tylko z tego, że sama klasa jest bardziej skomplikowana jako struktura. Na to już nic poradzimy. Widać jednak, że dzięki kilku prostym sztuczkom udało się bardzo mocno zoptymalizować działanie takiej aplikacji.