SOUHRN
Cílem práce bylo objektivní zhodnocení použitelnosti VNIR spektroskopie (spektroskopie ve viditelné a blízké infračervené části elektromagnetického spektra) pro predikci vlastností lesních půd. Pro každou půdní vlastnost byly hledány nejvhodnější kombinace metod statistického předzpracování (bez předzpracování, continuum removal, 1. a 2. derivace) a zpracování (PLSR – regrese částečných nejmenších čtverců, PCR – regrese hlavních komponent, SVM – support vector machines) v určitých spektrálních pásmech. Jako všeobecně nejúspěšnější se ukázala kombinace metod 1. derivace a SVM v celém VNIR spektrálním pásmu (400–2 500 nm). V některých případech (různé formy hořčíku, manganu, železa či hliníku) se však osvědčily modely jiné. Mezi nejlépe predikovatelné vlastnosti (R2 > 0,6) patří pH (půdní reakce), obsah oxidovatelného uhlíku, obsahy hliníku, železa, křemíku nebo vápníku (ve vyšších koncentracích). Nepříliš vysoká úspěšnost predikce (R2 < 0,3) byla zjištěna u ukazatelů, které nabývají nízkých hodnot (obsah sodíku, manganu nebo dvojmocné komplexy hliníku). Výsledky ukazují, že VNIR spektroskopie je použitelnou metodou pro predikci vlastností lesních půd. Nemůže zcela nahradit klasickou analýzu, ale může ji velice dobře doplňovat, a to především v praxi. Například při půdním mapování umí pomoci zahustit síť údajů a zpřesnit informace lépe než při použití jiných metod prostorového odhadu. Je použitelná v případech, kdy je zapotřebí získat značné množství údajů v krátkém časovém horizontu a s minimálními náklady. Je vhodná pro sledování trendů v čase nebo pro rychlý průzkum určité oblasti.
ÚVOD
Informace o půdních vlastnostech jsou vyžadovány pro různé účely, například pro precizní zemědělství či lesnictví, pro hodnocení kvality půdy, pro její mapování nebo ochranu. Při zkoumání půd je zapotřebí získat velké množství analytických dat. Odebírání a následné analyzování půdních vzorků tradičními metodami je časově náročné a finančně nákladné [1, 2]. Stále častěji se proto využívá nepřímých měření a predikcí půdních vlastností pomocí matematických modelů. Některé studie prokázaly, že spektroskopie ve viditelné (VIS) a blízké infračervené (NIR) části elektromagnetického spektra je vhodnou metodou pro hodnocení půdních vlastností. Doposud uveřejněné modely nejsou univerzální, jsou relevantní jen za specifických podmínek a pro určité skupiny půd. Cílem této studie je posouzení použitelnosti spektroskopie při hodnocení vlastností lesních půd v České republice na základě vztahů spektrálních znaků a půdních vlastností, stanovených tradičními laboratorními metodami. Pro toto hodnocení bylo použito více než 4 500 vzorků odebraných z celých půdních profilů. Pro tvorbu prediktivních modelů byly testovány vhodné kombinace metod přípravy dat (1. a 2. derivace [3], continuum removal) a statistických technik partial least squares regression (PLSR), support vector machines (SVM) a principal component regression (PCR).
METODIKA
Při zpracování studie bylo použito 4 680 vzorků odebraných z celých půdních profilů pomocí sondýrky nebo z kopaných půdních sond. Část půdních vzorků pochází ze zdrojů Katedry pedologie a ochrany půd (ČZU v Praze), ostatní vzorky byly zapůjčeny z jiných pracovišť. Místa odběrů byla zvolena tak, aby pokryla celé území ČR a aby se do zkoumání zahrnuly různé lesní půdní typy. Odběrová stanoviště byla umístěna v různých nadmořských výškách a v lesích s různou druhovou skladbou. Studie se nezabývala měřením v terénu, byly používány pouze vysušené vzorky upravené na jemnozem I (velikosti frakce < 2 mm) [4]. Tímto byl eliminován vliv vlhkosti půdy, který je pro průběh spektrálních křivek zásadní a značně znesnadňuje terénní použití metody. Na půdních vzorcích byly provedeny vybrané analýzy konvenčními metodami (tab. 1).
Tab. 1. Použité metody konvenční analýzy
Tab. 1. Used methods of conventional analysis
Měření spekter bylo prováděno na vzorcích upravených na jemnozem I v Petriho miskách spektrometrem FieldSpec 3 (ASD Inc., USA) s High Intensity Contact Probe (obr. 1). Rozsah spektrometru je 350–2 500 nm.
Obr. 1. Spektrometr FieldSpec 3 (foto: Josef Kratina)
Fig. 1. FieldSpec 3 spectrometer
Ke stanovení základních statistických popisných charakteristik byl používán program Statistica 12 (StatSoft). K předzpracování spektrálních dat, konkrétně k vyhlazení spektrálních křivek (splice correction), byl používán program ViewSpec Pro 6.0 (ASD Inc.). Program R (R Core Team) byl využit pro úpravu spekter pomocí continuum removal. Pro jejich kalibraci (partial least squares regression – regrese metodou částečných nejmenších čtverců, support vector machines, principal components regression) sloužily programy Unscrambler X 10.3 (CAMO Software) a R (R Core Team).
Byl statisticky hodnocen vztah spektrálních znaků a půdních vlastností, které byly získány tradičními laboratorními metodami. Byla testována vhodnost použití různých metod přípravy dat, jako je 1. a 2. derivace nebo continuum removal (sjednocení průběhu spektrálních křivek, jež jsou získány různými přístroji nebo za různých světelných podmínek). Publikované modely pro predikci půdních charakteristik ze spektrálních znaků byly testovány, upraveny jejich parametry, případně byly tvořeny nové modely pomocí statistických metod PLSR, PCR a SVM. Pro statistické hodnocení byla používána nejen všechna data dohromady, ale rovněž dělená do podsouborů podle oblastí odběrů a podle horizontů, aby bylo možno popsat nejvhodnější způsob zadávání dat pro úspěšnou predikci. Dále byl testován vliv použitého spektrálního pásma na úspěšnost předpovědi. Některé vlastnosti jsou lépe predikovatelné při použití celého VNIR spektra, pro jiné je vhodnější použití pouze určitého vybraného spektrálního pásma, které je vybíráno buď pokusně, nebo na základě literatury [13–16].
Nové modely byly ověřovány (validovány). Uváděné předpovědi vyjádřené hodnotami R2 (koeficient determinace) a RMSE (střední kvadratická chyba) jsou výsledkem cross validace, při níž se soubor dat rozdělí na více podsouborů, jeden (10 % z celku) se vyjme a zbylé se použijí pro kalibraci modelu. Poté je model aplikován na soubor, který byl předtím vyjmut, jsou srovnány hodnoty predikované modelem a změřeny v laboratoři. To se opakuje pro všechny podsoubory. Následně jsou spočítány parametry R2 a RMSE. Pro takto vzniklé skupiny byl kalibrován model. Posléze byly nové modely ještě podrobeny externí validaci, při níž byl model aplikován na jiný soubor dat a zjišťována úspěšnost predikce.
VÝSLEDKY A DISKUZE
Úspěšnost metody při predikci půdních vlastností je vysoce závislá na vhodném způsobu zadávání vstupních dat a jejich statistickém předzpracování a vyhodnocování. Cílem práce bylo nalezení nejvhodnější kombinace způsobu zadávání, statistického předzpracování a zpracování spektrálních dat pro dosažení nejlepších výsledků předpovědi půdních vlastností.
Celý datový soubor a jeho rozdělení podle horizontů a oblastí
Jako první byl statisticky hodnocen souhrnný datový soubor bez ohledu na příslušnost k oblasti odběru či horizontu. Byla použita spektra bez předzpracování v celém rozsahu 350–2 500 nm. Statistickou metodou byla – v literatuře často doporučovaná – regrese částečných nejmenších čtverců (PLSR). Na obr. 2, který znázorňuje všechna spektra dohromady, vidíme velkou variabilitu jejich průběhu. Ta může být způsobena různými půdními vlastnostmi, např. rozdílným množstvím půdní organické hmoty v minerálních a organických horizontech.
Obr. 2. Znázornění spekter – souhrnný soubor dat
Fig. 2. Spectra representation – the summary data set
Byly hledány vlastnosti společné pro co největší množství měřených vzorků. Konkrétně šlo o množství oxidovatelného uhlíku – Cox, celkový obsah dusíku a výměnnou půdní reakci – pH_CaCl2. Výsledky se zdají být velice dobré (Cox – R2 = 0,92, obsah dusíku – R2 = 0,77, pH_CaCl2 – R2 = 0,51), jejich publikace by však byla správná jen v případě výměnné reakce. Dle rozdělení četností dat jednotlivých vlastností je normální rozdělení pouze v případě výměnné půdní reakce. Výsledky obsahu oxidovatelného uhlíku a dusíku tvoří dva shluky. Ty poskytují při proložení regresní přímkou vysokou hodnotu koeficientu determinace. Výsledky jsou ovšem zkreslené, nelze je správně interpretovat. Predikce výměnné reakce je i přes nižší hodnotu koeficientu determinace úspěšnější. Jelikož pro uplatnění PLSR je normální rozdělení dat podmínkou, bylo třeba soubor podrobit jinému statistickému zpracování.
V tab. 2 jsou znázorněny výsledky predikce výměnné půdní reakce a obsahu dusíku při použití celého souboru i při jeho rozdělení na organické a minerální horizonty. Z výsledků je patrné, že na rozdíl od předchozích výsledků vykazuje celý soubor vyšší hodnotu koeficientu R2, avšak spolu s ním roste i střední kvadratická chyba (RMSE), jež by měla v ideálním případě naopak klesat.
Tab. 2. Úspěšnost predikce podle horizontů
Tab. 2. Predictions according to horizons
Z průběžných výsledků je patrné, že rozdělování datového souboru podle oblastí odběru vzorků nezvyšuje vždy prokazatelně úspěšnost predikce půdních vlastností, a nelze tedy tento způsob přípravy dat jednoznačně doporučit. V otázce dělení dat podle příslušnosti k půdnímu horizontu je závěr komplikovanější. V některých případech se takové rozdělení jeví jako výhodnější, v jiných je úspěšnost předpovědí vyjádřená koeficientem determinace výrazně lepší ve prospěch neděleného souboru. V takové situaci je však třeba sledovat i další veličinu popisující úspěšnost predikce, střední kvadratickou chybu, která by měla na rozdíl od koeficientu determinace klesat, k čemuž však ve výše uvedených případech nedošlo.
Organické a minerální horizonty mají zásadně odlišný charakter a většinou se u nich laboratorně stanovují rozdílné vlastnosti. Pokud jsou některé vlastnosti společně stanoveny pro horizonty celého půdního profilu, pak jsou na nich jasně patrné rozdíly. Data nemají normální rozdělení (je bimodální) a výsledky nelze správně interpretovat. Tento průběžný závěr byl dále ověřen použitím metody SVM, jež není tak zásadně citlivá na rozdělení dat jako regresní (lineární) metody.
Vliv použité statistické metody na úspěšnost predikce
Dále byla data podrobena různým kombinacím předzpracování (bez předzpracování, 1. a 2. derivace, continuum removal) a statistických metod (PLSR, PCR, SVM). Příklad změny průběhu spektrálních křivek podle použitého způsobu předzpracování je znázorněn na obr. 3. Takto byly pro každou vlastnost vždy vybrány dvě nejúčinnější kombinace, které byly jednotlivě precizovány.
Obr. 3. Průběh spektrálních křivek – různé způsoby předzpracování
Fig. 3. The course of spectral curves – various pre-processing methods
Viscarra Rossel a Behrens ve své práci [17] určili jako dvě nejúspěšnější metody SVM a PLSR. Výsledky této práce to potvrzují, především ve prospěch SVM, a přinášejí další informace díky kombinaci těchto metod s různými způsoby předzpracování. Ve většině případů byla zjištěna nejvyšší úspěšnost predikce při kombinaci 1. derivace spektrálních dat a metody SVM, dále pak PLSR na datech bez předpracování a SVM po provedení continuum removal. Další úspěšnou kombinací bylo v některých případech použití 2. derivace a SVM. Naopak regresní metody uplatněné na datech předzpracovaných 2. derivací byly jednoznačně nejméně úspěšné. Regresní metody PLSR a PCR poskytují velmi podobné výsledky, většinou v mírný prospěch PLSR.
Predikce jednotlivých vlastností
Na základě literatury [13, 14, 16] a výše uvedených poznatků byly hledány nejlepší kombinace použitého typu předzpracování, statistické metody a nově i vybraného spektrálního pásma. Pro každou vlastnost byly vybrány nejúspěšnější kombinace metod podle předchozích zjištění, které byly podrobeny dalšímu testování. Pro všechny vlastnosti byla společná úprava spekter oříznutím pásma 350–400 nm, jež je na rozhraní UV a viditelného záření výrazně rušeno šumem. Jako všeobecně nejlepší se ukazuje kombinace metody předzpracování spektrálních dat pomocí 1. derivace a statistické metody support vector machine při použití celého VNIR spektrálního pásma (400–2 500 nm). Existují ale případy, kdy se jako nejvhodnější ukázaly být jiné kombinace metod a jiná, užší spektrální pásma. Například vápník a hořčík stanovené ve výluhu lučavky královské byly nejlépe predikovatelné metodou PLSR aplikovanou na spektrální data upravená funkcí continuum removal v blízké infračervené části spektra 1 100–2 500 nm. Pro prvky stanovené v oxalátu byla místo SVM ve většině případů nejlepší metoda PLSR (Mg, Mn, Fe, Al). Rozmanitost modelů byla sledována především v případě predikce železa a hliníku, tedy dvou velmi sledovaných prvků v lesních půdách. Značně rozdílná je spektrální detekovatelnost jednotlivých forem hliníku. Nejméně úspěšně predikovatelná dvojmocná forma, která se váže na organickou hmotu, avšak je obsažena v extrémně malých množstvích, se může alternativně predikovat odečtením obsahu jednomocných a trojmocných komplexů od celkového obsahu stanoveného ve společném výluhu, v tomto případě výluhu KCl. V tab. 3 jsou znázorněny nejlepší modely pro predikci jednotlivých půdních vlastností, včetně validačního R2 a RMSE. Soubor je rozdělen podle příslušnosti k půdnímu horizontu nebo skupině horizontů.
Tab. 3. Nejlepší predikce podle metody a pásma – shrnutí
Tab. 3. The best prediction by method and band – summary
Testování a úprava nalezených modelů
Dále byly nalezené modely aplikovány na nezávislé soubory dat. Byly porovnávány úspěšnosti predikcí jednotlivých vlastností před a po aplikaci modelů. Data použitá jako ta „před aplikací modelu“ byla podrobena standardnímu statistickému zpracování, tedy metodě PLSR v celém VNIR pásmu na nepředzpracovaných spektrech. Modely, které zlepšily výsledky predikce, byly uznány za vhodné a univerzální. Pokud úspěšnost predikce vzrostla jen velmi málo, zůstala beze změny, nebo dokonce klesla, byly hledány jiné modely na základě dosavadních znalostí.
V tab. 4 jsou znázorněny vítězné modely pro predikci vlastností lesních půd. Kromě úspěšnosti predikce byl kladen důraz i na univerzálnost použití daných modelů. V případě, že byla určitá vlastnost stanovena různými způsoby, avšak model je pro všechny tyto způsoby společný, je v tabulce označena pouze daná vlastnost. Pokud způsob stanovení měl vliv na spektrální detekovatelnost, a vyžadoval tedy použití jiného modelu, jsou vlastnosti jednotlivě popsány i se způsobem stanovení.
Tab. 4. Nejlepší univerzální statistické modely pro predikci jednotlivých vlastností
Tab. 4. The best universal statistical models for the prediction of individual properties
ZÁVĚR
Cílem studie bylo objektivní zhodnocení použitelnosti spektroskopie ve viditelné a blízké infračervené části spektra pro predikci vlastností lesních půd. Tyto půdy se od zemědělských zásadně liší svým vzhledem, vývojem, fyzikálními i chemickými procesy, přítomností organických horizontů atd. Také se u nich obvykle sledují jiné vlastnosti. Bylo zjištěno, že dělení datového souboru podle oblastí odběru vzorku není významným vstupním kritériem, podstatnější je rozložení dat. Z důvodů velké rozdílnosti mezi organickými a minerálními horizonty se na základě výsledků doporučuje zkoumání těchto horizontů zvlášť.
Jelikož bylo k dispozici velké množství dat, bylo možno tato data rozdělit na větší soubor trénovací, na němž byly postupně důkladně trénovány jednotlivé modely, a soubor testovací, na kterém byly tyto modely testovány a na základě výsledků dále případně upravovány. Takto byly pro každou půdní vlastnost nalezeny nejvhodnější kombinace metod statistického předzpracování a zpracování v určitých spektrálních pásmech. Jako všeobecně nejúspěšnější se ukazuje kombinace metod 1. derivace a support vector machine v celém VNIR spektrálním pásmu (400–2 500 nm). V některých případech se však osvědčily modely jiné. Mezi nejlépe predikovatelné vlastnosti (R2 > 0,6) patří pH (půdní reakce), obsah oxidovatelného uhlíku, obsahy hliníku, železa, křemíku nebo vápníku (ve vyšších koncentracích). Nepříliš vysoká úspěšnost predikce (R2 < 0,3) byla zjištěna u ukazatelů, jež nabývají nízkých hodnot (obsah sodíku, manganu nebo dvojmocné komplexy hliníku).
Výsledky ukazují, že VNIR spektroskopie je použitelnou metodou pro predikci vlastností lesních půd. Není schopna zcela nahradit klasickou analýzu, ale může ji doplňovat. Například při půdním mapování pomůže zahustit síť údajů a zpřesnit informace lépe než při použití jiných metod prostorového odhadu. Je použitelná v případech, kdy je zapotřebí získat velké množství údajů v krátkém časovém horizontu a s minimálními náklady. Vhodná je pro sledování trendů v čase nebo pro rychlý průzkum vzorků z určité oblasti.
Poděkování
Autoři děkují Katedře pedologie a ochrany půd České zemědělské univerzity v Praze za poskytnutí technického vybavení a pomoc při zpracování této studie, která byla prováděna v rámci doktorského studia.
Příspěvek prošel lektorským řízením.