Tahmasebi fard M, Najafi F, Rezaeian S, Moradinazar M. How Can Causal Relationships Be Measured in Observational Studies? Propensity Score Matching: A Tutorial Article. JRUMS 2022; 21 (3) :343-366
URL:
http://journal.rums.ac.ir/article-1-6506-fa.html
طهماسبی فرد مینا، نجفی فرید، رضائیان شهاب، مرادی نظر مهدی. چگونه میتوان در مطالعات مشاهدهای روابط علیتی را سنجید؟ همسانسازی با نمره گرایش: یک مقاله آموزشی. مجله دانشگاه علوم پزشکی رفسنجان. 1401; 21 (3) :343-366
URL: http://journal.rums.ac.ir/article-1-6506-fa.html
دانشگاه علوم پزشکی کرمانشاه
متن کامل [PDF 657 kb]
(831 دریافت)
|
چکیده (HTML) (1493 مشاهده)
متن کامل: (1749 مشاهده)
مقاله مروری
مجله دانشگاه علوم پزشکی رفسنجان
دوره 21، خرداد 1401، 366-343
چگونه میتوان در مطالعات مشاهدهای روابط علیتی را سنجید؟ همسانسازی با نمره گرایش: یک مقاله آموزشی
مینا طهماسبی فرد[1]، فرید نجفی، شهاب رضائیان، مهدی مرادی نظر
دریافت مقاله: 11/02/1401 ارسال مقاله به نویسنده جهت اصلاح: 31/02/1401 دریافت اصلاحیه از نویسنده: 23/03/1401 پذیرش مقاله: 25/03/1401
چکیده
زمینه و هدف: در بیشتر مطالعات مشاهدهای پژوهشگران سعی در پیدا کردن روابط علیتی بین مشاهدات را دارند، این ارتباط سنجی به دلیل عدم کنترل متغیرهای مخدوشگر با خطا همراه است. یکی از روشهایی که برای کنترل متغیرهای مخدوشگر کاربردی است، همسانسازی با نمره گرایش است. لذا هدف از این مطالعه، توضیح مراحل انجام همسانسازی با نمره گرایش است.
مواد و روشها: همسانسازی نمره گرایش دارای 5 مرحله است. مرحله اول برآورد نمره گرایش است که شامل انتخاب مدل و متغیر مناسب میباشد. مرحله دوم، بر اساس نمرات گرایش برآورد شده باید تصمیم گرفت از میان روشهای تطبیق کدام روش را انتخاب کرد. مرحله سوم همپوشانی و پشتیبانی مشترک است، در این مرحله مشاهداتی که خارج از محدوده نمرات تطبیق قرار دارند، حذف میشوند. پس از آن کیفیت مطابقت، ارزیابی میشود و در نهایت باید حساسیت اثرات برآورد شده را تخمین زد.
یافتهها: در تطبیق نمره گرایش، متغیرهای اساسی مشاهده شده بین گروههای مواجهه و عدم مواجهه متعادل میشوند. با این حال، اگر مدل آماری مورد استفاده برای محاسبه نمره گرایش به درستی انتخاب نشده باشد، عدم تعادل بین ویژگیهای پایه دو گروه همچنان میتواند وجود داشته باشد.
نتیجهگیری: همسانسازی بر اساس نمره گرایش در مواردی که مخدوش کنندههای مطالعه زیاد باشند، مفید است. این روش در مطالعات مشاهدهای جایگزین تصادفیسازی در مطالعات تجربی است که با کاهش تورش انتخاب و کنترل متغیرهای مخدوشگر برآوردها را دقیقتر میکند.
واژههای کلیدی: همسانسازی نمره گرایش، متغیرهای مخدوشگر، مطالعات مشاهدهای
مقدمه
بیشتر مطالعات انجام شده در سیستم خدمات بهداشتی و درمانی از نوع مطالعات مشاهدهای است که در آن پژوهشگران سعی در پیدا کردن روابط علیتی بین مشاهدات را دارند که این ارتباط سنجی معمولاً به دلیل عدم کنترل متغیرهای مخدوشگر با خطا همراه است. این نوع مطالعات بیشتر در حوزههایی مانند روانشناسی و پزشکی مورد استفاده قرار میگیرند، چرا که در این حوزهها به خاطر مسائل اخلاقی امکان تصادفیسازی وجود ندارد. اعتبار نتایج مطالعات مشاهدهای کمتر از نتایج مطالعات کنترل شده هستند، چرا که بسیاری از آنها در برابر تورش انتخاب (Selection bias) آسیب پذیر میباشند. پژوهشگران اغلب تلاش میکنند این نقیصه را با به کارگیری روشهای آماری پیچیده مانند همسانسازی نمره گرایش جبران کنند [1].
همسانسازی یا تطبیق بر اساس نمره گرایش (Propensity score matching) توسط Rosenbaum و Rubin به عنوان یک روش جدید کنترل اثر متغیرهای مخدوشگر در سالهای اخیر مورد توجه بسیاری از محققین قرار گرفته است [2]. تحلیل نمره گرایش بیشتر زمانی مناسب است که به هر نحوی تصادفیسازی قابل انجام نباشد. در صورت اجرای مناسب تصادفیسازی در مطالعات مداخلهای تصادفی شده، تخصیص تصادفی تضمین میکند که بهطور متوسط، هیچ تفاوت سیستماتیکی در متغیرهای مخدوشگر اعم از مشاهده شده و مشاهده نشده بین گروههای مورد مطالعه وجود ندارد [3].
در مطالعات مشاهدهای یا نیمه تجربی، روش تصادفیسازی برای تخصیص افراد در گروههای مواجهه یافته و عدم مواجهه نمیتواند اعمال شود. بنابراین، انتساب افراد به بازوهای مطالعات مشاهدهای تصادفی نیست و در نتیجه، برآورد تأثیر مواجهه ممکن است همراه با وجود عوامل مخدوش کننده باشد. بنابراین، از تطبیق نمره گرایش به عنوان راهی برای کاهش سوءگیری و اصلاح "برآورد" اثرات مواجهه میتوان استفاده کرد [4].
در مطالعه حاضر، استفاده از همسانسازی نمره گرایش به منظور کاهش و کنترل اثر متغیرهای مخدوشگر شناخته شده در یک مثال تحت عنوان بررسی تأثیر آنزیم کبدی گاما گلوتامیل ترانسفراز (Gamma-glutamyl transferase) بر روی پرفشاری خون با استفاده از دادههای کوهورت بزرگسالان بیماریهای غیر واگیر روانسر (Ravansar non-communicable chronic disease) انجام شده است. مطالعه کوهورت آیندهنگر روانسر از مرداد 1393 آغاز شده و برنامهریزی شده است که افراد در فواصل منظم بهطور سالیانه و به مدت 15 سال مورد پیگیری مجدد و ارزیابی قرار گیرند [5].
مطالعه کوهورت روانسر یکی از 21 مرکز کوهورت پرشین (PERSIAN) میباشد که بر روی قوم کرد تحقیق میکند. هدف از انجام این کوهورت شناسایی و پیشبینی بروز بیماریهای مزمن غیر واگیر و مرگومیر مرتبط با آن و پیشگیری از عوامل خطر بیماریهای مزمن از جمله بیماریهای قلبی-عروقی، دیابت و فشارخون در شهرستان روانسر است. شهرستان روانسر یکی از شهرستانهای استان کرمانشاه میباشد. 10000 نفر از ساکنین شهری و روستایی در سنین 65-35 ساله در زمان اولین دوره جمعآوری اطلاعات وارد مطالعه شدند. اطلاعات کامل در خصوص مطالعه کوهورت پرشین که با همکاری کمیته تحقیقات گوارشی و وزارت درمان، آموزش پزشکی صورت گرفته در آدرس اینترنتی: http://persiancohort.com وجود دارد. برای اطلاعات بیشتر میتوان به پروتکل کوهورت روانسر مراجعه کرد [6].
فشارخون بالا یکی از مهمترین عوامل خطر بیماریهای قلبی-عروقی در سراسر جهان است. هرچند پرفشاری خون علامت نداشته و علل مختلفی در ایجاد آن نقش دارند اما میتوان با دارو آن را کنترل نمود. بر اساس گزارش سازمان بهداشت جهانی، فشارخون بالا بعد از دخانیات، به عنوان دومین عامل خطر اصلی مرگ در کشورهای در حال توسعه و سومین عامل خطر اصلی برای بیماریهای غیرواگیر معرفی شده است. شیوع این بیماری در جوامع گوناگون از 10درصد تا بیش از 60 درصد متغیر میباشد [7].
عوامل خطر پرفشاری خون به دو دسته غیر قابل تغییر مانند جنسیت، سن و سابقه فامیلی و قابل تغییر مانند چاقی، کم تحرکی، استرس، رژیم غذایی نامناسب و مصرف قرصهای پیشگیری از بارداری در زنان تقسیم میشوند. طبق مطالعاتی که تاکنون انجام گرفته است فاکتورهای سن، سیگار کشیدن، نمایه توده بدنی، رژیم غذایی پر چرب، مصرف نمک، فعالیت و تحرک بدنی کم، سطح سواد و نوشیدن مشروبات الکلی با پرفشاری خون رابطه داشتهاند ولی ارتباط بین اختلال عملکرد کبد و ایجاد فشارخون بالا به خوبی شناخته نشده است [8].
آنزیم کبدی گاما گلوتامیل ترانسفراز بهعنوان نشانگر بیولوژیکی مصرف بیشازحد الکل و استرس اکسیداتیو استفاده میشود. همچنین به عنوان شاخص اختصاصی عملکرد کبد به راحتی در سرم قابل اندازهگیری بوده و بنابراین تحقیقات بیشتر بر روی آنزیم کبدی گاما گلوتامیل ترانسفراز متمرکز شده است و شواهد نشان میدهد که ممکن است یک شاخص خطرناک برای پیشبینی مرگ و میر ناشی از تمام علل باشد [9]. لذا در مطالعه حاضر، به تأثیر آنزیم کبدی گاما گلوتامیل ترانسفراز بر روی پرفشاری خون با روش همسانسازی نمره گرایش پرداخته شده است. این ارتباط ممکن است تا حد زیادی تحت تأثیر عوامل متعدد مخدوشگر باشد. بنابراین، با استفاده از رویکرد همسانسازی نمره گرایش به عنوان یکی از راهحلهای ممکن با کنترل اثر متغیرهای مخدوشکننده، برای تخمین برآورد مناسب، از اثر این عوامل مخدوش کننده جلوگیری شد.
بهطور کلی طرح استنباط علّی در مطالعات مشاهدهای یا مطالعات بدون تصادفیسازی امری چالش برانگیز است و این دلیلی است که متخصصین آمار و اپیدمیولوژیستها را به تحقیق در مورد روشهای جدید تحلیلی، ترغیب کرده است. چالشهای این چنینی همانند استخراج استنباط علیتی از مطالعات مشاهدهای باعث نشأت گرفتن مطالعات بیشتر در زمینه روشهای جدید تحلیلی و همچنین باعث تمرکز بیشتر در مراحل انجام تحلیل نمره گرایش شده است [10]. لذا با توجه به اهمیتی که این روش در سالهای اخیر پیدا کرده است، در این مقاله سعی شده است که مراحل انجام روش همسانسازی نمره گرایش به صورت مختصر و با زبان ساده با استفاده از یک مثال واقعی توضیح داده شود. مثال استفاده شده در این مقاله، یک مطالعه کوهورت آیندهنگر میباشد که در متن مقاله از واژههای مواجهه و عدم مواجهه برای همسانسازی به روش نمره گرایش استفاده شده است.
چرا، چه موقع و چگونه به انجام همسانسازی نمره گرایش نیاز داریم؟
در تحقیقات بهخصوص در علوم رفتاری، بهداشتی و اجتماعی، کارآزمایی بالینی تصادفی شده، استاندارد طلایی برای تحقیق تلقی میشود، اما مطالعات تصادفی همواره از نظر عملی، اخلاقی و حتی مطلوب بودن همیشه ممکن نیستند ولی امکان طراحی مطالعات مشاهدهای وجود دارد. در طول 35 سال گذشته، محققان هنگام ارزیابی برنامههای مبتنی بر مطالعات مشاهدهای نیاز به رویکردهای کارآمد و مؤثرتر برای ارزیابی اثرات مواجهه تشخیص دادند. در پاسخ به این نیاز، تغییرات چشمگیری در روشهای ارزیابی ایجاد شده است [11].
در حال حاضر در مطالعات مشاهدهای، عمدتاً برای کاهش سوگیری و افزایش دقت مطالعه و همچنین برای تعیین روابط علیتی با کمترین مقدار خطا، زمانی که متغیرهای مخدوشگر مطالعه زیاد باشند میتوان از روشهای تطبیق نمره گرایش استفاده نمود [12]. از این روش میتوان برای متوازن کردن متغیرهای مخدوشگر در افرادی که در مواجهه هستند و همچنین افرادی که تحت مواجهه قرار نمیگیرند، استفاده کرد. به این صورت که نمره گرایش اجازه میدهد اثرات مواجهه را با شبیهسازی به یک مطالعه تصادفی به سبک ناپارامتریک (Randomized experiment in a non-parametric fashion) برآورد نماییم، یعنی مشاهدات در گروه مواجهه با مشاهداتی که در گروه عدم مواجهه (گروه کنترل) قرار دارند تطبیق داده میشوند [13]. در نهایت، هر مشاهده در گروه مواجهه با یک یا چند مشاهده در گروه کنترل بر اساس مقدار نمره گرایش متناظر میشود. نتیجه پیشبینی این است که تفاوتهای موجود در نتایج در میان هر جفت همسانسازی شده میتواند بیشتر به جهت اثر مواجهه باشد و نه به جهت تفاوتهای قابل مشاهده بین جفتها (Observable differences between pairs) [14]. بهطور کلی میتوان کاربرد نمره گرایش در مطالعات مشاهدهای را جایگزین تصادفیسازی در مطالعات تجربی کرد و همچنین رویکردهای تطبیق، یکی از راهحلهای ممکن برای کاهش خطاهای اندازهگیری، کاهش تورش انتخاب و همچنین با کنترل متغیرهای مخدوشگر تجزیهوتحلیل را راحتتر میکند [15].
مواد و روشها
روشهای مختلفی برای همسانسازی وجود دارد از جمله: روش همسانسازی با نمره گرایش (Propensity score matching)، طبقهبندی بر روی نمره گرایش (Stratification on the propensity score)، شیوه معکوس وزندهی (Inverse probability of treatment weighting; IPTW)، تعدیل متغیرها با استفاده از نمره گرایش (Covariate adjustment using the propensity score)، و یکی از رایجترین روشها برای ایجاد گروههای همسان استفاده از روش یادگیری ماشین (Machine learning) است [15]، که در این روش میتوان برای برآورد نمره گرایش دقیقتر از دو تکنیک مختلف Machine learning شامل (Least absolute shrinkage and selection operator; LASSO) و (Random forest) استفاده کرد. شواهد نشان میدهد که روش LASSO برای برآورد نمره گرایش بهخوبی عمل میکند، ولی استفاده از Random forest برای این منظور ممکن است منجر به نتایج گمراه کننده شود، به این دلیل که Random forest قادر به این نیست که متغیرهای مخدوشگر را به درستی بین دو گروه متعادل کند. بنابراین از اثر متغیرهای مخدوشگر جلوگیری نمیشود و همچنین سوءگیری در مطالعه باقی میماند [16].
از آنجایی که به نظر میرسد دانستن اینکه کدام یک از روشها میتواند بهطور مناسبتر عمل کند دشوار است، یک جایگزین قابل قبول این است از روشهای Causal machine learning، بهعنوان مثال Double machine learning پیشنهاد شده توسط Chernozhukov و یا Modified causal forest مطرح شده توسط Lechner، که بهطور خاص برای تخمین اثر درمان، بهینه شدهاند استفاده شود. بهطور کلی تخمین نمره گرایش با روش Machine learningدر مقایسه با روشهای تطبیق مرسوم فعلی به وضوح سودمند نیست. در عوض روشهای Causal machine learning که مستقیماً برای تخمین اثر درمان بهینهسازی شدهاند، ممکن است جایگزین امیدوارکنندهتری باشند [17]. همانطور که مورد اشاره قرار گرفت روشهای مختلفی برای همسانسازی وجود دارد اما در مقاله حاضر روش همسانسازی با نمره گرایش توضیح داده میشود.
مراحل انجام تطبیق نمره گرایش
همانطورکه نمودار 1 نشان میدهد، مراحل انجام همسانسازی با نمره گرایش شامل پنج مرحله است. مرحله اول برآورد نمره گرایش است، این مرحله شامل انتخاب مدل مناسب و انتخاب متغیرهای مخدوشگر میباشد. در مرحله دوم، بر اساس نمرات گرایش برآورد شده (در مرحله اول) باید تصمیم گرفت از میان الگوریتمهای مختلف، بهترین الگوریتم را انتخاب کنیم. مرحله سوم همپوشانی و پشتیبانی مشترک میباشد که در این مرحله مشاهداتی که خارج از محدوده نمرات گرایش قرار دارند، حذف میشوند. پس از آن، کیفیت مطابقت ارزیابی میشود.
در نهایت، در مرحله آخر باید حساسیت اثرات برآورد شده را تخمین زد. در صورت مناسب نبودن هر مرحله جهت اصلاح به مرحله قبل باز میگردیم [18].
