ข้อเข่าเสื่อม
ข้อเข่าเสื่อม (knee osteoarthritis, KOA) ไม่ใช่โรคของคนแก่ธรรมดา มันเป็นหนึ่งในโรคที่สร้างภาระด้านสุขภาพมากที่สุดในโลก ข้อมูลจากการศึกษา Global Burden of Disease ประเมินว่ามีผู้ป่วยมากกว่า 250 ล้านคนทั่วโลก และตัวเลขนั้นกำลังเพิ่มขึ้นเรื่อยๆ ตามการเปลี่ยนแปลงโครงสร้างประชากร
สิ่งที่ทำให้โรคนี้หนักหนาสาหัสเป็นพิเศษคือข้อเท็จจริงที่แพทย์และนักวิทยาศาสตร์ยอมรับตรงกัน: ข้อเข่าเสื่อมไม่มีทางรักษาให้หาย และไม่หายเองตามธรรมชาติ ผู้ป่วยต้องอยู่กับอาการปวดและสมรรถภาพที่เสื่อมถอยไปตลอดชีวิต กลยุทธ์การรักษาจึงต้องมุ่งเป้าไปที่ “การจัดการอาการเรื้อรัง” ไม่ใช่การรักษาให้หายขาด
ในช่วงที่ผ่านมา วงการแพทย์เริ่มตื่นตัวกับปัญหาการใช้ยากลุ่มโอปิออยด์ระยะยาวในผู้ป่วยกลุ่มนี้ เพราะความเสี่ยงต่อการเสพติดและผลข้างเคียงรุนแรงนั้นสูงเกินไปเมื่อเทียบกับประโยชน์ที่ได้รับ แนวทางปฏิบัติจาก OARSI, American College of Rheumatology, NICE และ EULAR ต่างเน้นย้ำการรักษาแบบไม่ใช้ยาเป็นหลักก่อน ไม่ว่าจะเป็นการออกกำลังกาย การลดน้ำหนัก และกายภาพบำบัดในรูปแบบต่างๆ
แต่ปัญหาหนึ่งที่การศึกษาพบคือ ผู้ให้บริการสุขภาพบางส่วนยังมองว่าการรักษาแบบไม่ใช้ยา รวมถึงอัลตราซาวด์บำบัด ขาดหลักฐานสนับสนุนที่แข็งแกร่งเพียงพอ ทำให้ยังถูกใช้น้อยกว่าที่ควรในทางปฏิบัติ ความเชื่อนี้เองที่เป็นจุดเริ่มต้นของการวิจัยชิ้นนี้
วิทยาศาสตร์เบื้องหลังคลื่นเสียง
ก่อนจะอ่านผลการวิจัย เราต้องทำความเข้าใจก่อนว่าอัลตราซาวด์บำบัดทำงานอย่างไร เพราะกลไกทางชีวฟิสิกส์เป็นรากฐานสำคัญที่ทำให้เชื่อว่าการรักษานี้น่าจะได้ผล
อัลตราซาวด์ที่ใช้ในทางการแพทย์ทำงานผ่านสองช่องทางหลัก ช่องทางแรกคือแบบใช้ความร้อน (thermal/continuous US) คลื่นเสียงความถี่สูงทำให้โมเลกุลของเนื้อเยื่อสั่นสะเทือนอย่างรวดเร็ว เกิดความร้อนเฉพาะที่ ซึ่งเพิ่มการซึมผ่านของหลอดเลือดฝอย กระตุ้นการเผาผลาญ ยืดหยุ่นของเนื้อเยื่อพังผืด และยกระดับเกณฑ์ความเจ็บปวด ช่องทางที่สองคือแบบไม่ใช้ความร้อน (non-thermal/pulsed US) ผ่านปรากฏการณ์ cavitation และ acoustic streaming จะปรับการซึมผ่านของเยื่อหุ้มเซลล์ กระตุ้นการสังเคราะห์โปรตีน และเพิ่มการตอบสนองทางภูมิคุ้มกันบริเวณรอยโรค
ในบริบทของข้อเข่าเสื่อม ซึ่งปัจจุบันเป็นที่ยอมรับกันแล้วว่ามีองค์ประกอบของการอักเสบอยู่ด้วย การที่อัลตราซาวด์บำบัดอาจลดกระบวนการอักเสบได้จึงเป็นเหตุผลทางทฤษฎีที่น่าสนใจ นอกจากนี้ การทบทวนวรรณกรรมล่าสุดยังพบว่า pulsed ultrasound ความเข้มต่ำมีผลดีต่อคุณสมบัติของกระดูกอ่อนในระดับเซลล์ โดยเฉพาะการเพิ่ม type II collagen ซึ่งเป็นโครงสร้างหลักของกระดูกอ่อนข้อต่อ และลดการแสดงออกของ metalloproteinase ซึ่งเป็นตัวกลางการอักเสบที่เอื้อต่อการเสื่อมของข้อ
อย่างไรก็ตาม ข้อจำกัดสำคัญของการศึกษาเหล่านั้นคือส่วนใหญ่ทำในสัตว์ทดลอง และยังไม่อาจแปลผลมาสู่มนุษย์ได้อย่างสมบูรณ์ ทฤษฎีนั้นสวยงาม แต่วิทยาศาสตร์ต้องการมากกว่าทฤษฎี
ออกแบบการค้นหาอย่างไรให้ตอบคำถามได้จริง
นี่คือจุดที่งานวิจัยชิ้นนี้แตกต่างจากการทบทวนวรรณกรรมที่ผ่านมาอย่างมีนัยสำคัญ
ทีมวิจัยสืบค้นฐานข้อมูล PubMed, MEDLINE, EMBASE, Google Scholar และ Cochrane ตั้งแต่จุดเริ่มต้นจนถึงเดือนพฤษภาคม 2562 โดยดำเนินงานตามมาตรฐาน PRISMA guidelines อย่างเคร่งครัด และใช้กรอบ PICO เป็นแนวทาง: ประชากรคือผู้ใหญ่ที่มีอาการ KOA, การแทรกแซงคืออัลตราซาวด์บำบัด, กลุ่มเปรียบเทียบคือ sham US หรือการไม่รักษา, และผลลัพธ์ที่สนใจคือความเจ็บปวด สมรรถภาพ และเหตุการณ์ไม่พึงประสงค์
การตัดสินใจออกแบบที่สำคัญที่สุดคือการคัดออกการศึกษาทุกชิ้นที่ใช้อัลตราซาวด์ร่วมกับการรักษาอื่น ไม่ว่าจะเป็นการออกกำลังกาย ประคบร้อน กายภาพบำบัดเพิ่มเติม หรือการฉีดยา นักวิจัยอธิบายว่าการผสมผสานการรักษาหลายอย่างพร้อมกันนั้นสร้าง clinical heterogeneity ที่บิดเบือนผล เพราะเมื่อกลุ่ม US และกลุ่มควบคุมต่างก็ใช้การรักษาเสริมที่ต่างกัน เราไม่มีทางรู้ได้เลยว่าผลที่เห็นมาจากอัลตราซาวด์หรือจากสิ่งอื่น
การทบทวนวรรณกรรมสองชิ้นที่ผ่านมาซึ่งสรุปว่าอัลตราซาวด์บำบัดมีประโยชน์ชัดเจนนั้น ล้วนมีข้อบกพร่องนี้ซ่อนอยู่ Zhang et al. (2016) รวม 9 การศึกษาเปรียบเทียบกับกลุ่มหลอก แต่หลายชิ้นใช้อัลตราซาวด์ควบคู่กับการออกกำลังกาย กายภาพบำบัด หรือฉีด hyaluronic acid ทำให้ภาพที่เห็นดีกว่าความเป็นจริง เมื่อตัดตัวแปรกวนออก ขนาดผลก็เล็กลงอย่างเห็นได้ชัด แต่ก็ยังคงมีนัยสำคัญทางสถิติ
คุณภาพระเบียบวิธีวิจัยในระดับการศึกษาประเมินด้วย Cochrane Risk of Bias tool ส่วนระดับผลลัพธ์ใช้ GRADE methodology การวิเคราะห์ใช้ random effects models ตาม DerSimonian and Laird method เพื่อรองรับความหลากหลายทางคลินิกและระเบียบวิธีที่หลีกเลี่ยงไม่ได้ระหว่างการศึกษา
ห้าการทดลองที่รอดจาก 265 รายการ
จากการสืบค้นเบื้องต้นได้ 265 รายการ หลังการคัดกรองอย่างเข้มงวดตามเกณฑ์รวม-ไม่รวม เหลือเพียง 5 การทดลองแบบสุ่ม (N = 264 ผู้เข้าร่วม) ที่ผ่านคุณสมบัติ สาเหตุหลักที่การศึกษาส่วนใหญ่ถูกคัดออกคือการผสมผสานอัลตราซาวด์บำบัดกับการรักษาอื่น
ทั้งห้าการศึกษามีลักษณะดังนี้: Ozgönenel et al. (2009, ตุรกี) ทดสอบ continuous US 1 MHz ความเข้ม 1 W/cm² เป็นเวลา 5 นาที ใน 5 ครั้งต่อสัปดาห์นาน 2 สัปดาห์ กับผู้เข้าร่วม 67 คน เปรียบเทียบกับ sham US ตามมาด้วย Tascioglu et al. (2010, ตุรกี) ซึ่งเป็นการทดลองสามแขนง ทดสอบทั้ง continuous และ pulsed US ที่ 2 W/cm² ใน 82 ผู้เข้าร่วม จากนั้น Loyola-Sanchez et al. (2012, แคนาดา) ทดสอบ pulsed US ความเข้มต่ำที่ 0.21 W/cm² ในระยะเวลานานกว่าคนอื่น คือ 3 ครั้งต่อสัปดาห์นาน 8 สัปดาห์ กับ 27 ผู้เข้าร่วม ส่วน Kulcü et al. (2009, ตุรกี) เป็นการศึกษาชิ้นเดียวที่ใช้ “ไม่รักษา” เป็นกลุ่มควบคุมแทน sham US และ Yegin et al. (2017, ตุรกี) มีการออกแบบที่แตกต่างสุด คือทดสอบการรักษาเพียงครั้งเดียวเท่านั้น ในผู้เข้าร่วม 62 คน
สังเกตได้ว่าการศึกษาส่วนใหญ่มาจากตุรกี อายุเฉลี่ยของผู้เข้าร่วมอยู่ระหว่าง 54–64 ปี สัดส่วนเพศหญิงอยู่ที่ 66–82% ทุกการศึกษาใช้ความถี่ 1 MHz แต่ความเข้มแตกต่างกันระหว่าง 0.21–2 W/cm² และจำนวนครั้งแตกต่างกันมากตั้งแต่ 1 ครั้งของ Yegin จนถึง 15 ครั้งใน 3 สัปดาห์ของ Kulcü ความหลากหลายนี้เองที่ฝังความท้าทายในการวิเคราะห์ไว้ล่วงหน้า
ตัวเลขพูดว่าอะไร
จาก 4 การศึกษาที่ใช้กลุ่มหลอก (sham-controlled) ครอบคลุมผู้เข้าร่วม 234 คน การวิเคราะห์อภิมานด้วย random effects models พบผลดังนี้
ด้านความเจ็บปวด (4 RCTs, n=234, ติดตาม 2–8 สัปดาห์): SMD = −0.33 (95% CI: −0.60 ถึง −0.07) แปลงเป็น % improvement บน VAS 0–100 ได้ประมาณ 9.6% (95% CI: 2.0–17.4%) มีนัยสำคัญทางสถิติ
ด้านสมรรถภาพที่รายงานด้วยตนเอง (3 RCTs, n=152, ติดตาม 2–8 สัปดาห์): SMD = −0.33 (95% CI: −0.65 ถึง −0.01) แปลงเป็น % improvement ได้ประมาณ 12.8% (95% CI: 0.4–25.2%) มีนัยสำคัญทางสถิติแต่ช่วงความเชื่อมั่นกว้างมาก
ด้านสมรรถภาพที่วัดจริง (6-minute walk test, 2 RCTs, n=87, ติดตาม 4–8 สัปดาห์): MD = 0.10 เมตร (95% CI: 0.04–0.16) มีนัยสำคัญทางสถิติแต่ขนาดผลเล็กมากในทางคลินิก
ด้านความปลอดภัย (4 RCTs, n=206): ไม่มีรายงานเหตุการณ์ไม่พึงประสงค์ใดเลยในทุกการศึกษา ไม่มีผู้ป่วยออกจากการศึกษาเพราะผลข้างเคียงของการรักษา
ผลจากการวิเคราะห์เสริมที่รวม Kulcü (กลุ่มไม่รักษา) เข้ามาด้วย ให้ขนาดผลที่ใหญ่กว่าเล็กน้อย: ความเจ็บปวด SMD = −0.45 (13% improvement), สมรรถภาพ SMD = −0.45 (17.4% improvement) ซึ่งสอดคล้องกับการที่กลุ่มเปรียบเทียบที่อ่อนแอกว่า (ไม่รักษาเลย) ย่อมทำให้กลุ่ม US ดูดีกว่า
อ่านตัวเลขให้ออก
SMD = −0.33 ฟังดูเป็นนามธรรม แต่มีความหมายที่ชัดเจนทางสถิติ ตามเกณฑ์ Cohen นี่คือขนาดผล “เล็ก” (small effect size) อยู่ในช่วง 0.2–0.5 ถ้าแปลสู่ชีวิตจริง: ผู้ป่วยที่เริ่มต้นที่คะแนนเจ็บปวด 60 จาก 100 คะแนน จะดีขึ้นมาอยู่ที่ประมาณ 54 คะแนน รู้สึกได้แต่ไม่ได้เปลี่ยนชีวิต
สิ่งที่น่าสนใจอย่างยิ่งคือความสอดคล้องระหว่างการศึกษา ค่า I² = 0% สำหรับทั้งความเจ็บปวดและสมรรถภาพ ซึ่งหมายความว่าผลลัพธ์ระหว่างการศึกษาสอดคล้องกันอย่างน่าทึ่ง ไม่มีการศึกษาชิ้นใดแสดงผลที่สวนทางอย่างรุนแรง นี่เป็นสัญญาณที่ดีว่าผลที่พบไม่ใช่ความบังเอิญ
ผลที่น่าสนใจอีกประการหนึ่งคือความแตกต่างระหว่างสมรรถภาพที่ “รายงานเอง” กับสมรรถภาพที่ “วัดได้จริง” อัลตราซาวด์บำบัดส่งผลดีต่อ WOMAC (แบบสอบถามรายงานตนเอง) อย่างมีนัยสำคัญ แต่ไม่ได้ส่งผลชัดเจนต่อระยะเวลาเดิน 20 หรือ 50 เมตร คำอธิบายที่ทีมวิจัยเสนอมีความลึกซึ้งทางวิชาการ: WOMAC ได้รับอิทธิพลอย่างมากจากระดับความเจ็บปวด เมื่อผู้ป่วยรู้สึกเจ็บปวดน้อยลง พวกเขามักประเมินสมรรถภาพของตนเองสูงกว่าความเป็นจริง ปรากฏการณ์นี้เรียกว่า “pain-function coupling” ซึ่งเป็นข้อควรระวังสำคัญในการออกแบบการวิจัยด้าน OA
GRADE — ชั่งน้ำหนักความน่าเชื่อถือ
p-value เพียงอย่างเดียวบอกไม่ได้ทั้งหมดว่าหลักฐานดีแค่ไหน GRADE methodology ประเมินคุณภาพผ่าน 4 มิติ
มิติแรกคือ Risk of Bias ซึ่งถูกจัดว่า “Serious” เพราะ 50% ของการศึกษาได้รับการจัดว่ามีความเสี่ยงสูงในอย่างน้อยหนึ่งมิติของ Cochrane Risk of Bias tool
มิติที่สองคือ Inconsistency ซึ่งถูกจัดว่า “Not serious” เพราะ I² = 0% บ่งบอกว่าผลระหว่างการศึกษาสอดคล้องกันดี
มิติที่สามคือ Indirectness จัดว่า “Not serious” เพราะการศึกษาตรงกับกลุ่มเป้าหมายและผลลัพธ์ที่ประเมินตรงกับคำถามทางคลินิก
มิติที่สี่คือ Imprecision จัดว่า “Serious” เพราะ 95% CI ของ SMD กว้าง ครอบคลุมช่วงที่มีนัยสำคัญทางคลินิกน้อย และกลุ่มตัวอย่างเล็กเกินไปในทุกการศึกษา
ผลรวมคือคุณภาพหลักฐานในระดับ “ต่ำมาก” (Very Low) ตามเกณฑ์ GRADE และนี่คือสิ่งที่ต้องทำความเข้าใจให้ถูกต้อง: Very Low ไม่ได้หมายความว่าการรักษา “ไม่ได้ผล” แต่หมายความว่าเรา “ไม่แน่ใจมากพอ” เกี่ยวกับขนาดผลที่แท้จริง เพราะการศึกษาที่มีอยู่มีจำนวนน้อยและคุณภาพระเบียบวิธีที่จำกัด ความแตกต่างระหว่าง “ไม่ได้ผล” กับ “ยังไม่มีหลักฐานเพียงพอ” นี้มีความสำคัญอย่างยิ่งในทางคลินิก