Сравнительный анализ алгоритмов классификации при анализе медицинских изображений по видеоданных спекл-трекинг эхокардиографии

التفاصيل البيبلوغرافية
العنوان: Сравнительный анализ алгоритмов классификации при анализе медицинских изображений по видеоданных спекл-трекинг эхокардиографии
المصدر: Innovative Biosystems and Bioengineering; Vol. 5 No. 3 (2021); 153-166
Innovative Biosystems and Bioengineering; Том 5 № 3 (2021); 153-166
بيانات النشر: Igor Sikorsky Kyiv Polytechnic Institute, 2021.
سنة النشر: 2021
مصطلحات موضوعية: випадковий ліс, адаптивний бустинг, стан серця, гармоничные структуры, heart condition, спекл-трекінг ехокардіографія, harmonic structures, случайный лес, метод групового урахування аргументів, coronary heart disease, логистическая регрессия, гармонічні структури, м, анализ медицинских изображений, group method of data handling, адаптивный бустинг, алгоритми класифікації, ишемическая болезнь сердца, логістична регресія, состояние сердца, classification algorithms, алгоритмы классификации, adaptive boosting, спекл-трекинг эхокардиография, метод группового учета аргументов, medical image analysis, ішемічна хвороба серця, speckle-tracking echocardiography, random forest, аналіз медичних зображень
الوصف: Background. Machine learning allows applying various intelligent algorithms to produce diagnostic and/or prognostic models. Such models can be used to determine the functional state of the heart, which is diagnosed by speckle-tracking echocardiography. To determine the patient's heart condition in detail, a classification approach is used in machine learning. Each of the classification algorithms has a different performance when applied to certain situations. Therefore, the actual task is to determine the most efficient algorithm for solving a specific task of classifying the patient's heart condition when applying the same speckle-tracking echocardiography data set. Objective. We are aimed to evaluate the effectiveness of the application of prognostic models of logistic regression, the group method of data handling (GMDH), random forest, and adaptive boosting (AdaBoost) in the construction of algorithms to support medical decision-making on the diagnosis of coronary heart disease. Methods. Video data from speckle-tracking echocardiography of 40 patients with coronary heart disease and 16 patients without cardiac pathology were used for the study. Echocardiography was recorded in B-mode in three positions: long axis, 4-chamber, and 2-chamber. Echocardiography frames that reflect the systole and diastole of the heart (308 samples in total) were taken as objects for classification. To obtain informative features of the selected objects, the genetic GMDH approach was applied to identify the best structure of harmonic textural features. We compared the efficiency of the following classification algorithms: logistic regression method, GMDH classifier, random forest method, and AdaBoost method. Results. Four classification models were constructed for each of the three B-mode echocardiography positions. For this purpose, the data samples were divided into 3: training sample (60%), validation sample (20%), and test sample (20%). Objective evaluation of the models on the test sample showed that the best classification method was random forest (90.3% accuracy on the 4-chamber echocardiography position, 74.2% on the 2-chamber, and 77.4% on the long axis). This was also confirmed by ROC analysis, wherein in all cases, the random forest was the most effective in classifying cardiac conditions. Conclusions. The best classification algorithm for cardiac diagnostics by speckle-tracking echocardiography was determined. It turned out to be a random forest, which can be explained by the ensemble approach of begging, which is inherent in this classification method. It will be the mainstay of further research, which is planned to be performed to develop a full-fledged decision support system for cardiac diagnostics.
Проблематика. Машинное обучение позволяет применить различные интеллектуальные алгоритмы для получения диагностических и (или) прогностических моделей. Подобные модели могут быть использованы для определения функционального состояния сердца, которое диагностируется с помощью спекл-трекинг эхокардиографии. Для того чтобы детально определить состояние сердца пациента, в машинном обучении используется подход классификации. Каждый из алгоритмов классификации имеет разную эффективность при применении в определенных ситуациях. Поэтому актуальной задачей является определение наиболее эффективного алгоритма для решения конкретной задачи классификации состояния сердца пациента при применении одинакового массива данных спекл-трекинг эхокардиографии. Цель. Оценить эффективность применения прогностических моделей логистической регрессии, метода группового учета аргументов (МГУА), случайного леса и адаптивного бустинга (AdaBoost) при построении алгоритмов поддержки принятия медицинских решений по диагностике ишемической болезни сердца. Методика реализации. Для выполнения исследования были использованы видеоданные спекл-трекинг эхокардиографии 40 пациентов с наличием ишемической болезни сердца и 16, у которых патология сердца обнаружена не была. Эхокардиография регистрировалась в B-режиме в трех позициях: по длинной оси, в 4-камерной и 2-камерной позициях. В качестве объектов для классификации были взяты кадры эхокардиографии, которые отражают систолу и диастолу сердца (таких всего оказалось 308 образцов). Для получения информативных признаков выбранных объектов был применен подход генетического МГУА для выявления наилучшей структуры гармоничных текстурных признаков. Сравнивалась эффективность таких алгоритмов классификации: метод логистической регрессии, классификатор МГУА, метод случайного леса и метод AdaBoost. Результаты. Построены 4 модели классификации для каждой из трех позиций B-режима эхокардиографии. Для этого выборки данных были разбиты на 3: обучающую (60 %), валидационную (20 %) и тестовую (20 %). Объективное оценивание моделей на тестовой выборке показало, что лучшим методом классификации является случайный лес (90,3 % точности на 4-камерной позиции эхокардиографии, 74,2 % на 2-камерной, и 77,4 % на длинной оси). Это также было подтверждено с помощью ROC-анализа, где во всех случаях случайный лес оказался наиболее эффективным в классификации состояния сердца. Выводы. Определен лучший алгоритм классификации в диагностике состояния сердца по спекл-трекинг эхокардиографии. Им оказался случайный лес, что можно объяснить ансамблевым подходом бегинга, который заложен в данном методе классификации. Именно он и будет опорой при проведении дальнейших исследований, которые планируется выполнять для разработки полноценной системы поддержки принятия решений при диагностике сердца.
Проблематика. Машинне навчання дає змогу застосувати різні інтелектуальні алгоритми для отримання діагностичних та(або) прогностичних моделей. Подібні моделі можуть бути використані для визначення функціонального стану серця, який діагностується за допомогою спекл-трекінг ехокардіографії. Для того щоб детально визначити стан серця пацієнта, в машинному навчанні використовується підхід класифікації. Кожен із алгоритмів класифікації має різну ефективність при застосуванні в певних ситуаціях. Тому актуальною задачею є визначення найбільш ефективного алгоритму для розвʼязання конкретної задачі класифікації стану серця пацієнта при застосуванні однакового масиву даних спекл-трекінг ехокардіографії. Мета. Оцінити ефективність застосування прогностичних моделей логістичної регресії, методу групового урахування аргументів (МГУА), випадкового лісу і адаптивного бустингу (AdaBoost) при побудові алгоритмів підтримки прийняття медичних рішень щодо діагностики ішемічної хвороби серця. Методика реалізації. Для виконання дослідження використано відеодані спекл-трекінг ехокардіографії 40 пацієнтів із наявністю ішемічної хвороби серця та 16 осіб, у яких патологію серця виявлено не було. Ехокардіографія реєструвалась у B-режимі в трьох позиціях: по довгій вісі, у 4-камерній та 2-камерній позиціях. Як об’єкти для класифікації були взяті кадри ехокардіографії, що відображають систолу та діастолу серця (таких усього виявилось 308 зразків). Для отримання інформативних ознак вибраних об’єктів було застосовано підхід генетичного МГУА для виявлення найкращої структури гармонічних текстурних ознак. Порівнювалась ефективність таких алгоритмів класифікації: метод логістичної регресії, класифікатор МГУА, метод випадкового лісу та метод AdaBoost. Результати. Побудовано 4 моделі класифікації для кожної із трьох позицій B-режиму ехокардіографії. Для цього вибірки даних були розбиті на 3: навчальну (60 %), валідаційну (20 %) і тестову (20 %). Об’єктивне оцінювання моделей на тестовій вибірці показало, що найкращим методом класифікації є випадковий ліс (90,3 % точності на 4-камерній позиції ехокардіографії, 74,2 % на 2-камерній і 77,4 % на довгій вісі). Це також було підтверджено за допомогою ROC-аналізу, де в усіх випадках випадковий ліс виявився найбільш ефективним у класифікації стану серця. Висновки. Визначено найкращий алгоритм класифікації в діагностиці стану серця за спекл-трекінг ехокардіографією. Ним виявився випадковий ліс, що можна пояснити ансамблевим підходом бегінгу, який закладений у цьому методі класифікації. Саме він і буде опорою при проведенні подальших досліджень, які планується виконувати для розробки повноцінної системи підтримки прийняття рішень при діагностиці серця.
وصف الملف: application/pdf
اللغة: Ukrainian
تدمد: 2616-177X
URL الوصول: https://explore.openaire.eu/search/publication?articleId=scientific_p::009c3504e40658a539d17a52cbe5e552
http://ibb.kpi.ua/article/view/234990
Rights: OPEN
رقم الانضمام: edsair.scientific.p..009c3504e40658a539d17a52cbe5e552
قاعدة البيانات: OpenAIRE