Плани та методи клінічних досліджень
1. Основні методи рандомізації
Одним з основних положень дизайну клінічного дослідження є рандомізація, тобто процес випадкового розподілу варіантів досліду між об'єктами.
Розподіл варіантів лікування у випадковому порядку не може бути досягнутий шляхом безладного відбору. Якщо в процесі відбору бере участь людина, ніяка схема відбору не може вважатися по-справжньому випадковою.
Відомо з практики, що якщо у учасників дослідження з'являється можливість впливати на результати дослідження, то ця можливість обов'язково використовується. Задача рандомізації саме і полягає в тому, щоб забезпечити такий підбір хворих, при якому контрольна група відрізнялася б від експериментальної тільки методом лікування.
Слово «випадковість» в його звичайному розмовному значенні застосовується до будь-якого методу вибору, що не має певної мети. Проте вибір, що проводиться людиною, не є випадковим в строгому значенні, оскільки на практиці він не вибирає однаково часто ті події, які можна вважати рівноімовірними.
Існує тільки один спосіб отримати процедуру істинно випадкового відбору – скористатися яким-небудь незалежним від людини методом, наприклад, використовувати датчик (або таблицю) випадкових чисел.
Так, проста рандомізація була заснована на прямому використанні такої таблиці. Числа в таблиці випадкових чисел згруповані так, щоб імовірність для кожного з однозначних чисел опинитися в будь-якому місці таблиці, була однакова (рівномірний розподіл).
Крайній лівий стовпчик таблиці є номером рядка, верхній рядок – номери згрупованих по 5 стовпчиків. Довільно вибираються початкова точка (перетин рядка з якимось номером і стовпчика (або стовпчиків) у залежності від того, скільки знаків має бути у випадкових числах, які необхідно отримати) і напрям руху. Кількість пацієнтів, яких необхідно розсортувати за групами, визначає, які числа відбиратимуться: при n<10 тільки однозначні числа; при n = 10-99 – двозначні і т.д.
Наприклад, для розподілу 99 пацієнтів у три групи вибираємо початкову точку на перетині довільного рядка і двох сусідніх стовпчиків, а також напрямок руху. Вибираємо двозначні числа. Зустрівши числа 1-33, розмістимо чергового пацієнта в першу групу, числа 34-66 – у другу групу, 67- 99 – у третю.
Для розподілу на дві групи можна діяти так: зустрівши парні номери, відправляти чергового пацієнта в першу групу, а непарні – в другу. Проте такий метод може привести до формування різних за чисельністю груп.
Не має цього недоліку метод послідовних номерів. Кожному пацієнту привласнюють номер, що є випадковим числом з таблиці випадкових чисел. Потім ці номери ранжируються в порядку зростання і відповідно до вибраного правила розподіляють методи лікування.
Наприклад, для розподілу на дві групи: парні номери в ранжированому ряду – перша група, непарні – друга. Проте число пацієнтів у групах врівноважується тільки до кінця процедури рандомізації.
Метод адаптивної рандомізації підтримує рівну кількість пацієнтів у групах протягом всієї процедури рандомізації. В загальному вигляді така процедура припускає, що на початку лікування пацієнти розподіляються рівноімовірно, потім перед тим, як визначити, до якої групи віднести чергового пацієнта, оцінюється чисельність вже створених на даний момент груп.
Якщо чисельність груп однакова, лікування розподіляють рівноімовірно, якщо чисельність однієї з груп перевершує іншу, імовірність потрапити в цю групу знижується.
Добре зберігає рівну чисельність груп протягом всього процесу рандомізації і метод блокової рандомізації. Хворих, яких передбачається включити в дослідження, умовно поділяють на рівні блоки. В межах блока методи лікування розподіляються так, щоб різними методами лікувалася однакова кількість пацієнтів, але послідовність призначення лікування була б різною. Потім блоки випадково розподіляють, наприклад, користуючись таблицею випадкових чисел.
Для підвищення ефективності рандомізації і поліпшення однорідності груп застосовується метод стратифікаційної рандомізації. При цьому за основними прогностичними ознаками формуються однорідні групи (страти). Для кожного конкретного дослідження вибираються прогностичні фактори, пов'язані як із захворюванням, так і з особливостями пацієнтів.
Після надходження відомостей про чергового хворого і визначення його стратифікаційної групи за обраною схемою розподіляються методи лікування. Схеми розподілу лікування в межах групи можуть бути аналогічні запропонованим раніше, наприклад, можна використовувати змінну послідовність двох варіантів лікування і призначати їх пацієнтам, що надходять у випадковій послідовності.
Наступні два методи рандомізації були засновані на процедурах, запозичених з теорії ігор. Щоб краще зрозуміти їх значення, уявіть собі, що ви опинилися в казино і перед вами — різні ігрові автомати. Час гри обмежений. Яку стратегію вам вибрати для отримання максимального виграшу?
Отже, розглянемо три варіанти стратегії:
а) рухаючись від автомата до автомата, грати з кожним з них по одному жетону, поки який-небудь автомат не заплатить вам виграш. Після цього продовжувати грати на цьому автоматі весь час, що залишився, незалежно від подальших результатів;
б) грати на кожному автоматі кілька разів незалежно від результату, щоб визначити «частоту» виграшу для кожного з них, а потім продовжувати грати з «кращим»;
в) переходити до наступного автомата тільки після поразки на попередньому. Продовжувати грати на одному і тому самому автоматі, поки вам вдається вигравати у нього.
Зрозуміло, що, вибравши першу стратегію, ви ризикуєте весь час грати на автоматі, що залишився, виграти на якому вам вдалося одного разу і, можливо, лише випадково.
В області клінічних досліджень метод рандомізації, заснований на третій стратегії, носить назву «гра на лідера».
Метод «гра на лідера» – перший пацієнт одержує методи лікування рівноімовірно, потім у разі успіху терапії наступний пацієнт також одержує це лікування, у разі невдачі – інше. Пацієнти, які вже отримали лікування, його продовжують. Цей дизайн вважається не дуже вдалим, оскільки така процедура практично не має «пам'яті», навіть після серії успіхів достатньо однієї невдачі для зміни вибору терапії.
Метод «однорукий бандит» – процедура адаптивного розміщення, постійно коректується в міру появи нової інформації про порівнювані терапії з метою підвищення імовірності розміщення пацієнта в групи, які одержують більш успішну терапію.
Основна ідея має відношення швидше до другої ігрової стратегії: на даному етапі не завжди потрібно розміщувати чергового пацієнта в групу, яка в даний момент вважається найуспішнішою. Можливо, що наших знань ще недостатньо, щоб точно оцінити, який метод краще, тому на даному етапі необхідно продовжити збір інформації.
При цьому виявляються групи з найбільшою імовірністю успіху. У разі двох останніх процедур рандомізації більшість пацієнтів одержує кращий метод лікування. Проте може виникнути істотна різниця в чисельності груп, що ускладнить надалі статистичний аналіз. Крім того, для таких стратегій необхідно мати точне визначення успіху для методів лікування, що вивчаються.
2. Основні типи планів
Розглянемо деякі плани досліджень, що часто зустрічаються.
Перехресний план (cross-over design) — схемно можна уявити собі таким чином: є два лікарські препарати А і В, в результаті всі пацієнти одержують і ліки А, і ліки В. Для цього пацієнтів якимось чином поділяють на групи, одна група одержує терапію АВ, інша – ВА. Між призначенням двох різних препаратів існує так званий часовий проміжок (wash-out реriod) виведення ліків з організму для виключення взаємовпливу препаратів, що вивчаються.
Такий дизайн часто застосовується у фармакокінетичних і фармакодинамічних додатках, при виборі оптимальних доз препарату, оцінюванні біоеквівалентності тощо.
Оскільки в даному випадку не враховується міжгрупова варіабельність, даний дизайн за деяких умов вимагає меншої кількості пацієнтів, що включаються. Іншою перевагою цього підходу є можливість враховувати зауваження пацієнтів.
Проте даний метод має і недоліки. Ефекти різних лікувань можуть перекриватися і змішуватися, крім того, план, що включає період виведення ліків з організму, може виявитися безвідповідальним з погляду етики. У разі вибування пацієнта після завершення першого етапу неможливо використовувати його дані на етапі статистичного аналізу.
План латинських квадратів — групи пацієнтів підбираються так, щоб кількість пацієнтів у групі збігалася з кількістю випробовуваних препаратів. Пацієнти одержують всі ліки по 1 разу в різній послідовності. Можна збільшити кількість пацієнтів у групі пропорційно кількості випробовуваних препаратів. При цьому, наприклад, у випадку 3 препаратів дозволити 4-му пацієнту вибирати будь-яку послідовність прийому, 5-му — одну з двох, що залишилися, і т.д. У разі порівняння М лікарських препаратів буде потрібно М, 2М, 3М і т.д. пацієнтів. У таблиці наведений план латинських квадратів 4x4.
А |
В |
С |
Д |
В |
С |
Д |
А |
С |
Д |
А |
В |
Д |
А |
В |
С |
Так само, як при перехресному плані, в даному випадку існує можливість враховувати думку пацієнтів, і для проведення дослідження не вимагається великої кількості пацієнтів. Аналогічно перехресному плану серед недоліків можна назвати можливу наявність ефекту дії, що продовжується, і існування ризику можливого виключення цілого блоку пацієнтів. Крім того, зібрані відповідно до такого плану дані потребують складного статистичного аналізу, наприклад, з використанням методів дисперсійного аналізу.
Мультиперехресний план — схемно можна зобразити таким чином: препарат, що вивчається, – А, плацебо – П. Кожен пацієнт одержує послідовність АПАПАПАП або ПАПАПАПА. Проміжки часу отримання А і П однакові, а в кінці кожного фіксуються показники стану пацієнта. Метою такого дослідження є встановлення того, що препарат А дає більший ефект, ніж П. Для цього розглядаються суміжні періоди терапії і обчислюється, наприклад, узагальнений показник, що дорівнює загальній кількості періодів А, по закінченні яких стан пацієнта був краще, ніж після закінчення відповідного періоду П. У разі даної схеми залежно від мети дослідження плацебо може бути замінено препаратом в іншому дозуванні або тим самим препаратом, виготовленим іншою фармацевтичною компанією, що вивчається.
Умовою для вживання такого плану є короткий період виведення препарату і досить швидке відновлення симптомів хвороби після припинення лікарської терапії. У разі виконання всіх умов застосування така модель досить добра для правильного обліку реакцій пацієнтів на препарат, що вивчається.
Можна ввести для такої моделі поняття «індекс ефективності». Припустимо, в дослідженні передбачено n періодів, число різниць між показниками до і після чергового періоду (позначимо їх Yi) дорівнює відповідно n — 1. Тоді індекс ефективності можна визначити як
Позитивне значення даного показника свідчить про ефект лікування, близькість до нуля – про відсутність такого ефекту, негативне – про негативний ефект.
План паралельних груп – найпоширеніший варіант; біля 95% клінічних досліджень проводиться відповідно до плану такого типу. Загальна кількість пацієнтів при цьому залежить, у тому числі, від кількості груп, і може виявитися достатньо великою з урахуванням міжіндивідуальних відмінностей. За допомогою вказаних вище способів рандомізації пацієнтів випадковим чином розподіляють у групи. Точне порівняння ефективності різних методів лікування можливе лише при дотриманні умов однорідності груп хворих, що порівнюються, за всіма ознаками.
Деяка модифікація цього методу – багатогрупова модель застосовується, наприклад, під час вивчення впливу різних доз препарату. Крім того, відома так звана неоднорідна модель, у цьому випадку на першому етапі всі пацієнти одержують лікування, що вивчається, а потім пацієнти, які продемонстрували наявність реакції на терапію, що проводиться, за допомогою методів рандомізації розподіляються за групами для проведення подальшого дослідження.
План «гра на лідера» – припустимий, порівнюються 2 варіанти терапії, кожен пацієнт одержує одну і ту саму терапію (різні пацієнти починають з різних терапій) протягом стількох тимчасових інтервалів, поки в кінці одного з них не буде знайдений «неуспіх». Після цього у даного пацієнта відбувається зміна терапії.
Послідовний план застосовується для дослідження нових сильнодіючих препаратів, крім того, у разі вживання плану паралельних груп такий підхід можна використовувати, якщо результат порівняння стає очевидним ще до кінця дослідження. Цей статистичний метод застосовується для порівняння двох препаратів або препарату з плацебо. Необхідною умовою є достатньо швидкий прояв ефекту лікування, тому зазвичай використовується у разі лікування гострих захворювань.
При цьому кількість пацієнтів не визначається наперед (відкритий дизайн), а процес дослідження зупиняється після отримання інформації про ефект під час чергової інспекції результатів, якщо була знайдена яскраво виражена перевага одного з методів.
Відома також модифікація даного методу, коли максимальний розмір груп обмежується на етапі планування (закритий дизайн). Існують різні правила зупинника (або останову — технічний термін) такої процедури дослідження. Найвідомішим є граничний підхід (boundary арproach): наперед окреслюється область продовження дослідження (залежно від мети дослідження) на графіку залежності кумулятивної відмінності величин ефекту до моменту даної інспекції Zi від іншої статистичної інформаційної змінної К (як К може використовуватися і кількість включених пацієнтів), в термінах якої вимірюється варіабельність Zi за умови справедливості нульової гіпотези про відсутність ефекту терапії. Наприклад, у разі урахування ефекту в альтернативній формі (є — ні) можливий такий варіант розрахунку статистики Zi = (iSe- Sc)/2, де Se та Sc – успіхи в порівнюваних терапіях відповідно.
Статистика V= S- F/(4n), де S, F і n – загальне число успіхів, невдач і пацієнтів відповідно. Верхня і нижня межі області продовження дослідження обчислюються так, щоб при їх перетинанні дослідження можна було зупинити, зробивши однозначний висновок про перевагу однієї з терапій. Класичний підхід до послідовного дизайну припускає проведення попарних порівнянь пацієнтів у групах.
Проте дуже мало клінічних досліджень дійсно проводилося за такою схемою, оскільки випадково вибрані пари можуть істотно відрізнятися за багатьма прогностичними чинниками. Для усунення цього обмеження був запропонований так званий груповий послідовний дизайн, який передбачає розподіл всієї множини пацієнтів на підгрупи, кількість яких дорівнює кількості передбачуваних інспекцій результатів.
У кожній підгрупі половина пацієнтів одержує одну терапію, половина іншу терапію, статистичний аналіз проводиться щоразу, як тільки закінчується збір інформації для чергової підгрупи. І щоразу дані для вже проаналізованих підгруп перераховуються. Рівень значимості при такій процедурі вибирається з урахуванням множинних порівнянь. В іншому, цей підхід не відрізняється від класичного.
Оскільки на відміну від плану паралельних груп в даному випадку кількість пацієнтів не визначається наперед, не може виникнути ситуація, коли зібраних даних не вистачає для формування статистично значущого висновку про відмінність в ефекті.
Мультицентрові дослідження — це дослідження, які проводяться за єдиною методикою і програмою одночасно в декількох лікувальних установах, що дозволяє скоротити терміни збирання необхідного обсягу інформації. Кількість пацієнтів при цьому зростає не пропорційно, оскільки необхідно врахувати міжцентрову варіацію параметрів, що цікавлять. Існує думка, що мультицентрові клінічні дослідження можуть виявитися неефективними, якщо в кожному центрі у процес дослідження була включена різна кількість пацієнтів.
Статистичний аналіз даних мультицентрових досліджень вимагає особливої уваги. Багато вчених сходяться на думці, що, незважаючи на те, що в основі мультицентрових досліджень лежить єдиний протокол, умови проведення дослідження в кожному центрі можуть приводити до такої істотної міжцентрової варіації даних, коли результати таких досліджень можна розглядати як окремий випадок метааналізу.
Метааналіз і об'єднання даних (роoling) — процес узагальнення результатів різних досліджень на одну тему із застосуванням спеціальних процедур синтезу даних. До такого об'єднання зазвичай вдаються у випадку, якщо об'ємів окремих досліджень виявляється недостатньо для формування статистично значущого висновку. При цьому існують 2 підходи до аналізу даних:
1) об'єднання даних окремих досліджень і проведення аналізу для всієї сукупності, неначе вони були отримані в одному дослідженні;
2) проведення аналізу отриманих даних для кожного дослідження окремо і подальше об'єднання не даних, а статистичних результатів.
Таке об'єднання результатів не може проводитися шляхом обчислення звичайних середніх значень. Під час проведення метааналізу використовують процедури «зважування» даних різних джерел відповідно до кількості включених пацієнтів, процедури аналізу тощо. Найпростіший спосіб для розуміння такого об'єднання результатів – графічний.
На один і той самий графік наносять довірчі інтервали для показника ефекту, що цікавить, обчислені в різних дослідженнях. Перевагою об'єднання даних є можливість отримання статистично достовірного висновку внаслідок збільшення загального об'єму вибірки. Проте відомі і супротивники такого підходу.
На їх думку, процедури відбору пацієнтів, методи проведення досліджень і оцінки ефекту можуть настільки варіюватися, що об'єднання результатів втрачає будь-яке практичне значення. Тому дані для проведення метааналізу мають спеціальним чином підбиратися.