Kvalita dat je ve výzkumu zásadní. Nekvalitní data mohou vnášet zkreslení do analýz či vést k nesprávným závěrům. Jedním ze zdrojů zkreslení měření u sebehodnotících dotazníků jsou samotní respondenti, konkrétněji jejich odpovídací strategie či styly. Kromě záměrného lhaní, sociální žádoucnosti či chybných odpovědí kvůli neporozumění zadání mohou být respondenti jednoduše nedostatečně motivováni k poskytnutí přesné odpovědi. Právě na odhalování těchto nepřesných odpovědí způsobených nízkou motivací se zaměřil výzkumný tým Tomáše Řiháčka z Katedry psychologie a Jaroslava Gottfrieda z IVDMR.
Existující metody sloužící k identifikaci nepřesných či nevalidních odpovědí v dotaznících s sebou mnohdy přináší vysoké nároky na úroveň statistických znalostí výzkumníka či je imitují designy studií. Toto řeší jednoduchá a zdarma přístupná internetová aplikace navržená právě Řiháčkem a Gottfriedem. Internetová aplikace je doporučená pro uživatele, obeznámeni se statistickým softwarem R, naopak pro uživatele, kteří mají alespoň základní zkušenosti s tímto programem, by mohl být balíček lepší volbou.
Balíček v softwaru R se jmenuje responsePatterns a je volně dostupný (zde). Aplikace a R balíček stojící na principu autokorelační screeningové metody představují účinný způsob, jak odpovědi nedbalých respondentů odhalit a tím přispět ke zvýšení kvality výzkumných dat. Shiny web aplikace obsahuje stručný návod na provádění autokorelačního screeningu a je volně k dispozici k použití online. Dovoluje jednoduché nahrání dat v CSV, excel či SPSS formátech, nabízí snadnou analýzu autokorelací a poskytuje obsáhlý přehled výsledků.
Aplikace a balíček se zaměřují na specifický typ nedbalého odpovídání – opakující se vzorce odpovědí. Tyto odpovědi se mohou skládat z jakékoli série odpovědí, které se několikrát opakují. Vzorec opakované odpovědi na typické pětibodové škále Likertova typu může tedy vypadat například takto: 1-2-3-4-5-1-2-3-4-5. Vzorce se mohou lišit kombinací odpovědí, délkou (tj. počtem odpovědí, než se vzorec začne opakovat), rozsahem (tj. rozsahem odpovědí využitých z dostupných možností škály) a konzistencí (vzorec se může, ale nemusí přesně opakovat). Velký počet možných opakujících se vzorců odpovědí je pravděpodobně hlavním důvodem, proč se jim ve výzkumu kvality dat věnovala malá pozornost a dosud nebyl vyvinut žádný specializovaný nástroj pro jejich odhalování.
V porovnání s existujícími metodami kontroly kvality dat jsou silné stránky autokorelačního screeningu v jednoduchosti a rychlosti výpočtu, v absenci požadavku na speciální položky nebo zaznamenávání času odpovědi a vysoké citlivosti na opakující se vzorce odpovědí.
Nevýhodou pak může být poměrně slabé teoretické zázemí o opakujících se vzorcích odpovědí jako formě nedbalého odpovídání a nedostatek empirických důkazů o jeho vlivu na skutečná dotazníková data (aplikace byla testována na simulovaných datech).
Odborný článek, jehož praktickým výstupem je právě webová aplikace, je dobrým začátkem pro řešení těchto nedostatků. Článek poskytuje teoretická východiska a metodické základy pro následné empirické posouzení autokorelační metody a současně nabízí praktický a jednoduchý způsob, jak autokorelační screeningovou metodu použít. Pokud tedy chcete rychle a jednoduše vytipovat případné nedbalé odpovědi ve vašich datech, můžete zvolit právě uvedenou webovou aplikaci či balíček v Rku.
Gottfried, J., Ježek, S., Králová, M., & Řiháček, T. (2022). Autocorrelation Screening: A Potentially Efficient Method for Detecting Repetitive Response Patterns in Questionnaire Data. Practical Assessment, Research, and Evaluation, 27(1), 2.