Ces Radiol 2016;70(1): 16 -22
Existují statisticky signifikantní rozdíly mezi hodnoceními MR nálezů bederní páteře mezi jednotlivými lékaři. Nejmenší jsou mezi zkušenými radiology.
Heřman M, Urban P, Procházka B, Čecháková E, Veverková L, Sedláčková Z, Hrabálek L, Wanek T, Stejskal P, Vaněčková M, Vaňásek J, Ryška R Jaká je míra shody různých hodnotitelů u MR vyšetření bederní páteře?
Cíl: Posoudit, zda a jak se liší hodnocení nálezů degenerativních změn bederní páteře na magnetické rezonanci (MR) mezi zkušenými radiology, radiologickými rezidenty a lékaři jiných odborností zabývajícími se touto problematikou.
Metodika: Devět hodnotitelů ze tří skupin: zkušení radiologové (ZR), radiologičtí rezidenti (RR) a neradiologové (NR) posoudilo nezávisle MR vyšetření bederní páteře u 55 pacientů. Hodnotitelé posuzovali ve všech segmentech bederní páteře přítomnost a stupeň postižení sedmi parametrů: stav ploténky, protruze či hernie ploténky změny signálu obratlových těl, posun obratlů, dorzální osteofyty artrotické změny na intervertebrálních kloubech a šíři ligamenta flava. Statistické hodnocení míry shody mezi jednotlivými hodnotiteli MR nálezů bylo provedeno na jednotlivých segmentech bederní páteře pomocí Fleissova kappa; pro srovnání hodnocení stupně závažnosti MR nálezu byl použit Friedmanův test a mnohonásobné párové porovnání Nemenyiho post hoc testem.
Výsledky: Míra shody v celkovém hodnocení MR nálezu na jednotlivých segmentech bederní páteře se pohybovala v rozmezí hodnot kappa od 0,32-0,80, nejčastěji v rozmezí 0,5-0,7, byla tedy průměrná až nadprůměrná. Při statistickém testování shody v hodnocení stupně závažnosti MR nálezu jsme mezi jednotlivými hodnotiteli prokázali statisticky signifikantní rozdíl (p < 0, 0001). V každé skupině hodnotitelů (ZR, RR, NR) byl vždy jeden, který se v hodnocení "stupně závažnosti" MR nálezu statisticky významně lišil od ostatních dvou. Rozdíly byly nejmenší mezi zkušenými radiology.
Závěr: Prokázali jsme statisticky signifikantní rozdíly mezi hodnoceními MR nálezů mezi jednotlivými lékaři i uvnitř jednotlivých skupin. Mezi zkušenými radiology byly tyto rozdíly nejmenší.
Klíčová slova: MR, bederní páteř, hodnocení
There are statistically significant differences among individual physicians in the assessment of MR of the lumbar spine. They are smallest among experienced radiologists.
Heřman M, Urban P, Procházka B, Čecháková E, Veverková L, Sedláčková Z, Hrabálek L, Wanek T, Stejskal P, Vaněčková M, Vaňásek J, Ryška P. What is the degree of agreement among different evaluators at the lumbar spine MRI examinations?
Aim: To assess differences in the evaluation of degenerative changes of the lumbar spine MRI among experienced radiologists, radiology residents and other specialists.
Method: Nine evaluators from three groups: experienced radiologists (ER), radiology residents (RR) and non-radiologists (NR) independently assessed MRI examinations of the lumbar spine of 55 patients. All segments of the lumbar spine were evaluated for presence and degree of severity of changes in seven parameters: disc height, disc protrusion or herniation, vertebral body signal changes, spondylolisthesis, dorsal osteophytes, arthritic changes on the intervertebral joints and thickness of ligamenta flava. Statistical evaluation of the degree of agreement among multiple observers was made in individual segments of the lumbar spine by Fleiss kappa; the degree of severity of MRI findings was assessed by Friedman test and pairwise multiple comparisons by Nemenyi post hoc test.
Results: Degree of agreement in the overall MRI comparison in individual segments of the lumbar spine ranged from 0.32 to 0.80 kappa values, most frequently from 0.5 to 0.7 - it was moderate or substantial. Testing of the degree of severity of MRI findings showed a statistically significant differences (p < 0.0001) among individual evaluators. In each group of evaluators (ER, RR, NR) was always one evaluator who differed significantly from the other two. These differences were smallest among experienced radiologists.
Conclusion: We found statistically significant differences in the assessment of MRI findings among individual evaluators and also within groups of evaluators. These differences were smallest in the group of experienced radiologists.
Key words: MRI, lumbar spine, evaluation