25 มิถุนายน 2548
การคำนวณอัตราความชุกของมะเร็ง
25 มิ.ย. 2548
เนื่องจากโรคมะเร็งหลายโรคเป็นโรคที่รักษาให้มีชีวิตยืนยาวได้ แต่เนื่องจากผู้ป่วยมีชีวิตที่ยืนยาวนั่นเอง ทำให้มีผู้ป่วยจำนวนหนึ่งที่ไม่สามารถติดตามได้โดยทะเบียนมะเร็ง แม้แต่ทะเบียนมะเร็งในต่างประเทศที่มีระบบติดตามผู้ป่วยที่ดีอย่างในเครือข่าย SEER ของอเมริกา (SEER, 2005) หรือในเครือข่ายทะเบียนมะเร็งยุโรปโดยคณะทำงาน EUROPREVAL ซึ่งใช้ฐานข้อมูล EUROCARE-2 (Capocaccia et al, 2002; Micheli et al, 2002) ในการหาอัตราความชุกของโรคมะเร็ง จึงไม่สามารถใช้การนับจำนวนผู้ป่วยโดยตรงจากทะเบียนมะเร็งได้ด้วยสาเหตุสำคัญต่อไปนี้คือ 1. ผู้ป่วยมะเร็งในบางอวัยวะมีชีวิตยืนยาวเกินกว่าอายุดำเนินการของทะเบียนมะเร็ง ทำให้จำนวนสะสมของโรคมะเร็งนั้นยังไม่คงที่ 2. มีผู้ป่วยมะเร็งจำนวนหนึ่งที่ไม่สามารถติดตามสถานภาพชีวิตได้ จึงไม่ทราบว่าผู้ป่วยเสียชีวิตแล้วหรือยังมีชีวิตอยู่ ณ เวลาที่คำนวณอัตราความชุก 3. ผู้ที่รอดชีวิตอยู่ได้นาน มีโอกาสที่จะเป็นและเสียชีวิตจากโรคอื่นที่ไม่ใช่โรคมะเร็ง 4. มีผู้ป่วยจำนวนหนึ่งที่มีประวัติการเป็นมะเร็งจากมรณบัตรเท่านั้น 5. ผู้ป่วยมีการย้ายที่อยู่ระหว่างเป็นโรค 6. ผู้ป่วยบางรายเป็นมะเร็งมากกว่าหนึ่งตำแหน่ง และ 7. ความครบถ้วนของการเก็บจำนวนผู้ป่วย ดังนั้นการคำนวณอัตราความชุกโดยตรงจึงจะทำได้ในทะเบียนมะเร็งที่เก็บข้อมูลได้ครบถ้วนมาก ติดตามผู้ป่วยได้ทุกรายหรือเกือบทุกราย ผู้ป่วยไม่เคลื่อนย้าย และติดตามสถานะชีพของผู้ป่วยในทุกขณะเวลาเท่านั้น ซึ่งเป็นเงื่อนไขที่ไม่เป็นจริงในทะเบียนมะเร็งเกือบทั้งหมด
ในการคำนวณอัตราความชุกของโรคมะเร็งทำได้สองวิธี คือ 1. ความชุกสมบูรณ์ (complete prevalence) และ 2. ความชุกจำกัดช่วงเวลา (duration-limited prevalence) (SEER, 2005) ความชุกสมบูรณ ์คือความชุกที่คำนวณจากช่วงเวลาตั้งแต่เริ่มการวินิจฉัย ถึงวันที่คำนวณเป็นเวลายาวนานตลอดอายุขัยที่เป็นไปได้ของคน ส่วนความชุกจำกัดช่วงเวลา เป็นความชุกที่คำนวณจากผู้ที่วินิจฉัยโรคย้อนหลังจากวันคำนวณไปเท่ากับเวลาที่กำหนด เช่น 10 หรือ 20 ปีย้อนหลัง แต่เนื่องจากทะเบียนมะเร็งเกือบทั้งหมดในโลกไม่มีข้อมูลนานพอที่จะคำนวณความชุกสมบูรณ์ได้โดยตรง การจะคำนวณความชุกสมบูรณ์จึงต้องใช้วิธีการโมเดลทางสถิติเกือบทั้งสิ้น หรือเลี่ยงไปใช้การคำนวณความชุกจำกัดช่วงเวลา
ในที่นี้จะได้กล่าวถึงกลุ่มของวิธีการคำนวณอัตราความชุกเป็นสามกลุ่มคือ 1. วิธีคำนวณความชุกสมบูรณ์โดยวิธีตรง ซึ่งมีทะเบียนมะเร็งเพียงไม่กี่แห่งในโลกเท่านั้นที่ทำได้ แต่สมควรกล่าวไว้เป็นพื้นฐาน เพราะจะถูกใช้เป็นค่าอ้างอิงอยู่เสมอ 2. วิธีคำนวณแบบแจงนับ (counting method) ซึ่งจะได้ความชุกจำกัดช่วงเวลา และ 3. วิธีคำนวณโดยใช้โมเดลทางสถิติ (statistical modeling) ซึ่งส่วนใหญ่จะพยายามคาดประมาณอัตราความชุกสมบูรณ์
1. วิธีที่ง่ายที่สุดคือวิธีที่ใช้แต่เพียงการคาดประมาณผู้ที่คาดว่าจะมีชีวิตอยู่รอด ณ วันที่คำนวณคาดประมาณอัตราความชุก (Feldman et al, 1986) โดยใช้ข้อมูลโดยตรงภายในทะเบียนมะเร็ง (incidence case) แล้วตัดผู้ที่เสียชีวิตก่อนวันนั้นออกไปทั้งหมด แล้วรวมผู้ที่ทราบว่ายังมีชีวิตอยู่ เข้ากับผู้ที่คาดว่าจะมีชีวิตอยู่ในกรณีที่ไม่ทราบสถานะชีพ ณ วันที่จะหาอัตราความชุกนั้น จำนวนผู้ป่วยที่ขาดการติดตามแต่คาดว่ายังมีชีวิตอยู่คำนวณโดย
CP = sqrt(Pi) x Pi+1 x Pi+2 x … x Pj-1 x Pj
โดยที่ CP คือโอกาสที่ผู้ป่วยที่ขาดการติดตามยังมีชีวิตอยู่ ณ วันที่คำนวณอัตราความชุก และ Pi คือโอกาสที่ผู้ป่วยยังมีชีวิตอยู่ในปีแรกถ้าผู้ป่วยขาดการติดตาม Pi+1, … , Pj-1, Pjคือโอกาสที่ผู้ป่วยที่วินิจฉัยในปีก่อนหน้านั้นจะยังมีชีวิตอยู่จนถึงปีก่อนที่จะคำนวณอัตราความชุก (j = ปีก่อนการคำนวณ) ผลรวมของ CP ในแต่ละรายที่ขาดการติดตามจะเท่ากับผลรวมของจำนวนคาดประมาณของผู้ป่วยที่ขาดการติดตามแต่ยังมีชีวิตอยู่ ณ วันที่คำนวณอัตราความชุก
การคำนวณเช่นนี้มีข้อจำกัดที่สำคัญคือ เป็นการคำนวณความชุกสมบูรณ์ จึงทำได้เฉพาะในทะเบียนมะเร็งที่ดำเนินการมายาวนานมากๆ เท่านั้น เช่นที่
ข้อจำกัดอีกประการหนึ่งของวิธีนี้คือ การคำนวณอยู่บนพื้นฐานว่าเมื่อผู้ป่วยได้รับการวินิจฉัยว่าเป็นมะเร็งชนิดใดชนิดหนึ่งแล้ว ก็จะเป็น prevalent case ตลอดไปจนกว่าจะเสียชีวิต โดยไม่ได้คำนึงถึงผลของมะเร็งทุติยภูมิที่อาจจะเกิดขึ้นหลังจากนั้น และไม่ได้คำนึงถึงความเป็นไปได้ที่จะถือว่าผู้ป่วยได้หายจากโรคแล้ว (Coldman et al, 1992)
สำหรับทะเบียนมะเร็งที่ดำเนินการมาได้สักระยะหนึ่ง แต่ไม่นานพอที่จะคำนวณอัตราความชุกสมบูรณ์ได้ ก็จำเป็นต้องใช้อัตราความชุกจำกัดช่วงเวลา แม้แต่ SEER เองก็ได้ใช้วิธีนี้ในการคำนวณอัตราความชุกสำหรับทะเบียนมะเร็งแห่งอื่นๆ เช่นกัน (SEER, 2005) โดยมีผู้ใช้วิธีการคำนวณที่แตกต่างกันกับข้อมูลของ SEER (Coldman et al, 1992; Gail et al, 1999; Merrill et al, 2000)
2. วิธีแจงนับ (counting method) ซึ่งวิธีคำนวณได้แสดงไว้ในบทความของ Gail และคณะ (Gail et al, 1999) โดยพื้นฐานของวิธีแจงนับคือการนำอัตราอุบัติการณ์มาคิดร่วมกับสัดส่วนการอยู่รอด โดยจำแนกรายการข้อมูลในทะเบียนเป็นสี่กลุ่มคือ 1. ผู้ที่มีวันวินิจฉัยและเสียชีวิตก่อนจุดเวลาที่ต้องการคำนวณอัตราความชุก 2. ผู้ที่มีวันวินิจฉัยก่อนและมีวันเสียชีวิตหรือวันที่ติดต่อครั้งสุดท้ายหลังจุดเวลาที่คำนวณ 3. ผู้ที่มีวันวินิจฉัยก่อนและไม่ทราบสถานะชีพหลังจุดเวลาที่คำนวณ (มีวันติดต่อครั้งสุดท้ายก่อนจุดเวลาที่คำนวณ) และ 4. ผู้ที่มีวันวินิจฉัยหลังจุดเวลาที่คำนวณ ผู้ป่วยกลุ่มที่สองและสามเท่านั้นที่นำมาแจงนับหาอัตราความชุก สำหรับผู้ป่วยในกลุ่มที่สองนั้นสามารถนำมานับได้เลย ส่วนผู้ป่วยในกลุ่มที่สามจำเป็นต้องคาดประมาณโอกาสที่จะยังมีชีวิตรอดเสียก่อน โดยทั่วไปจะหาค่าโอกาสที่จะอยู่รอดจากสัดส่วนการอยู่รอดที่คำนวณจากในทะเบียนนั้นเอง แต่ก็มีโอกาสเกิดความลำเอียงแบบ survivorship bias ได้
การคำนวณอัตราความชุกโดยวิธีนี้ มีเงื่อนไขสำคัญที่จะต้องระลึกไว้เสมอในการนำไปใช้อยู่สามประการคือ 1. เป็นอัตราความชุกจำกัดช่วงเวลา ตามรายงานของ SEER ใช้ช่วงเวลา 10 ปี จากปี 1980 ถึง 1989 ในการคำนวณ ทั้งนี้เป็นข้อจำกัดของระยะเวลาในการดำเนินการของทะเบียนมะเร็งนั้นเอง 2. ช่วงเวลาของสัดส่วนการอยู่รอดใช้ช่วงเวลา 5 ปี โดยถือว่าสัดส่วนการอยู่รอดหลัง 5 ปีไปแล้วมีค่าเท่ากับที่เวลา 5 ปี เงื่อนไขนี้เป็นจริงในบางโรค ใกล้เคียงแต่ไม่เป็นความจริงนักในโรคอื่นๆ 3. คิดอัตราความชุกเฉพาะผู้ป่วยที่มีอายุไม่เกินอายุ 50 ปีเท่านั้น เนื่องจากในผู้ที่มีอายุไม่เกิน 50 ปี สัดส่วนการอยู่รอดไม่แปรตามอายุมากนัก
แม้ว่า Gail และคณะแนะนำให้ใช้สัดส่วนการอยู่รอดที่คำนวณโดยวิธี actuarial แต่น่าจะเป็นไปได้ที่จะใช้อัตราการอยู่รอดสัมพัทธ์ (relative survival) เพราะโดยหลักการคำนวณแล้วก็คล้ายกับวิธี actuarial เช่นกัน และทะเบียนมะเร็งในปัจจุบันได้ใช้วิธีนี้ในการหาอัตราการอยู่รอดอยู่แล้ว และนอกจากนี้ในการคำนวณที่แสดงในบทความนั้น จะใช้อัตราส่วนของสัดส่วนการอยู่รอด การใช้อัตราการอยู่รอดสัมพัทธ์แทนนั้น จึงน่าจะตัดอิทธิพลของ expected survival ที่แฝงอยู่ใน relative survival ออกไปได้ และได้ผลเช่นเดียวกับการใช้สัดส่วนการอยู่รอดที่หาโดยวิธี actuarial นั่นเอง
วิธีนี้มีทั้งข้อจำกัดและข้อได้เปรียบเมื่อเทียบกับวิธีการอื่นๆ ที่จะกล่าวต่อไป เนื่องจากใช้ข้อมูลจริงจากในทะเบียนมะเร็ง จึงไม่ต้องอาศัยการแก้สมการทางสถิติ แต่มีข้อจำกัดที่ต้องหาอัตราส่วนของสัดส่วนการอยู่รอดสำหรับผู้ป่วยในกลุ่มสามทุกราย ซึ่งเป็นเรื่องยุ่งยากและใช้เวลาสำหรับทะเบียนที่มีข้อมูลจำนวนมาก
3. วิธีการโมเดลทางสถิติ (statistical modeling) การโมเดลทางสถิติต่างจากวิธีการแจงนับ คือใช้ข้อมูลในทะเบียน ร่วมกับข้อมูลในประชากรมาทำเป็นความสัมพันธ์ทางสถิติเสียก่อน แล้วจึงแก้สมการเพื่อหาอัตราความชุกต่อไป สมการมีฟังก์ชันสองส่วนคูณกันคือ ส่วนของจำนวนผู้ป่วยกับส่วนของการรอดชีวิต มีผู้เสนอวิธีการคำนวณมากกว่าหนึ่งวิธี ซึ่งมีความต่างกันในการโมเดลฟังก์ชันทั้งสอง (ซึ่งอาจสัมพันธ์กันเองอยู่ด้วย) โดยอาจเป็นความสัมพันธ์ระหว่างอัตราอุบัติการณ์กับสัดส่วนการอยู่รอด หรืออัตราอุบัติการณ์กับอัตราตาย หรืออัตราตายกับสัดส่วนการอยู่รอดก็แล้วแต่ ในที่นี้จะกล่าวถึงสองวิธีคือ ก. วิธีการโมเดลโดยใช้อัตราการเปลี่ยนสถานะ (transition rate) และ ข. วิธีการโมเดลโดยใช้ฟังก์ชันอุบัติการณ์
ก. วิธีการโมเดลโดยใช้อัตราการเปลี่ยนสถานะ (transition rate) เป็นวิธีที่แสดงโดย Gail และคณะเช่นกัน (Gail et al, 1999) โดยใช้สมการพื้นฐานเช่นเดียวกับวิธีแจงนับ แต่แทนที่จะหาจำนวนผู้ป่วยโดยนับจำนวนผู้ป่วยในทะเบียนโดยตรง ก็ใช้วิธี derive สมการทางสถิติเพื่อใช้คาดประมาณจำนวนผู้ป่วยแทน โดยอินติเกรตฟังก์ชันของ survival probability ระหว่างช่วงอายุที่สนใจ ซึ่งเป็นฟังก์ชันที่ผู้เขียนเรียกว่า transition intensity
ข. วิธีการโมเดลโดยใช้ฟังก์ชันอุบัติการณ์ (incidence function) เป็นวิธีที่นำเสนอโดย Merrill และคณะ (Merrill et al, 2000) โดยทดสอบกับข้อมูลในทะเบียนมะเร็งของ SEER โดยใช้อัตราความชุกของมะเร็งจากทะเบียนมะเร็ง
วิธีนี้เป็นการหาโมเดลทางสถิติที่ fit กับข้อมูลที่มีอยู่ โดยตั้งเงื่อนไขเริ่มต้นว่าอัตราความชุกเป็นการอินติเกรตผลคูณของฟังก์ชันของ incidence กับฟังก์ชันของ survival โดยตั้งสมมุติฐานว่า incidence function เป็นฟังก์ชันของอายุและ birth cohort แล้วในที่สุดพิสูจน์ได้ว่า incidence function ของแต่ละ birth cohort เป็นฟังก์ชันของอายุ และมีความสัมพันธ์กันในรูปสมการ logistic ส่วนโมเดลของ survival นั้นใช้ relative survival โดยตั้งสมมุติฐานว่า cumulative relative survival จากอายุหนึ่งถึงอายุที่มากขึ้นเป็นฟังก์ชันของอายุที่วินิจฉัยและอายุที่ยังอยู่รอด โดยมีความสัมพันธ์เป็นฟังก์ชัน Weibull เมื่อแก้สมการทั้งสองได้แล้ว จึงคำนวณอินติเกรตตลอดช่วงอายุทั้งหมด ก็จะได้จำนวนผู้ป่วยที่มีอยู่ในประชากรนั้นๆ แล้วนำมาหารด้วยจำนวนประชากรทั้งหมด ก็จะได้อัตราความชุกคาดประมาณ
เนื่องจากสัดส่วนการอยู่รอดสัมพันธ์อยู่กับอายุดังที่กล่าวแล้วในวิธีแจงนับข้างต้น ดังนั้นวิธีนี้จึงเป็นการนำอายุของผู้ป่วยมาคิดด้วย แทนที่จะตัดผู้ที่มีอายุมากกว่า 50 ปีทิ้งไปเช่นที่ทำในวิธีแจงนับ ทำให้ได้ความชุกสมบูรณ์ และยังนำเอาความสัมพันธ์ระหว่างอัตราอุบัติการณ์กับอายุมาคิดอีกด้วย
การหาอัตราความชุกโดยวิธีนี้ ให้ผลใกล้เคียงกับความชุกสมบูรณ์เมื่อนำไปทดสอบกับข้อมูลของทะเบียนมะเร็ง
4. วิธีผสมการแจงนับและโมเดล (mixed counting and modeling) เป็นวิธีที่ใช้โดย EUROPREVAL (Capocaccia et al, 2002; Micheli et al, 2002) ซึ่งประกอบด้วยสองขั้นตอน ขั้นตอนแรกเป็นการหา observed prevalence โดยการสร้าง matrix ของจำนวนเริ่มต้นผู้ป่วยในสามมิติเวลาโดยใช้หน่วยเป็นปี คือ ปีปฏิทิน อายุ และจำนวนปีหลังจากวินิจฉัยโรค แล้วจึงโมเดลหาจำนวนผู้ป่วยที่เหลือในแต่ละเซลล์จากเวลาเริ่มต้นไปจนถึงเวลาสุดท้าย จากนั้นคำนวณ total prevalence โดยหาร observed prevalence ด้วย prevalence completeness index (R) โดยค่า R จะขึ้นกับช่วงเวลาดำเนินการของทะเบียน cancer specific incidence rate จำแนกตามกลุ่มอายุ และ cancer specific survival rate จำแนกตามกลุ่มอายุ
การโมเดลในลักษณะนี้น่าจะทำได้ไม่ยาก เพราะไม่ต้องแก้สมการทางสถิติ เพียงแต่ใช้ข้อมูลที่มีอยู่แล้ว เช่น survival probability function เพื่อคาดประมาณจำนวนผู้ป่วยที่จะอยู่รอดในเวลาที่ผ่านไป จึงเป็นวิธีที่น่าจะทำได้ในทะเบียนมะเร็งของประเทศไทย
สรุปผลการศึกษา
จากการค้นคว้าเอกสารต่างๆ ในการคำนวณอัตราความชุกของโรคมะเร็งนั้น พอจะสรุปได้ว่ามีความเป็นไปได้ที่จะคาดประมาณอัตราความชุกของโรคมะเร็งในประเทศไทยโดยสองวิธีคือ 1. คำนวณอัตราความชุกจำกัดช่วงอายุ 10 ปี โดยวิธีของ Gail และคณะ และ 2. คาดประมาณอัตราความชุกโดยวิธีโมเดลโดยใช้วิธีของ EUROPREVAL ทั้งสองวิธีจะทำได้ทันทีกับข้อมูลทะเบียนมะเร็งในประเทศไทยต่างๆ ที่ดำเนินการมาเกิน 15 ปี ซึ่งได้แก่ทะเบียนมะเร็งเชียงใหม่ ลำปาง ขอนแก่น และสงขลา ส่วนทะเบียนมะเร็งกรุงเทพขาดข้อมูลอัตราการอยู่รอด ซึ่งอาจจะอนุโลมใช้อัตราการอยู่รอดรวม (pooled relative survival) ของประเทศ โดยอาศัยข้อมูลจากทะเบียนมะเร็งภูมิภาคสี่แห่งมาคำนวณรวมกัน
ในที่นี้เห็นว่าวิธีของ EUROPREVAL น่าจะนำมาใช้ในประเทศไทยมากที่สุด เนื่องจากมีเครือข่ายทะเบียนมะเร็งของยุโรปที่มีทะเบียนมะเร็งถึง 38 แห่งใน 17 ประเทศใช้อยู่แล้วเป็นมาตรฐาน แต่ไม่ว่าจะใช้วิธีใดก็ตาม น่าจะต้องมีการศึกษาในรายละเอียดต่อไป เนื่องจากเอกสารที่ตีพิมพ์ในวารสารไม่ให้รายละเอียดมากพอในด้านวิธีการคำนวณทางสถิติบางประการ และไม่ได้แสดง algorithm การคำนวณด้วยโปรแกรมคอมพิวเตอร์
เอกสารอ้างอิง
Capocaccia R., Colonna M.,
Coldman A.J., McBride M.L., Braun T. (1992) Calculating the prevalence of cancer. Stat Med, 11, 1579-1589.
Feldman A.R., Kessler L., Myers M.H., Naughton M.D. (1986) The prevalence of cancer: estimates based on the Connecticut Tumour Registry.
Gail M.H., Kessler L., Midthune D., Scoppa S. (1999) Two approaches for estimating disease prevalence from population-based registries of incidence and total mortality. Biometrics, 55, 1137-1144.
Merrill R.M., Capocaccia R., Feuer E.J., Mariotto A. (2000) Cancer prevalence estimates based on tumour registry data in the surveillance, epidemiology, and end results (SEER) program. Internatl J Epidemiol, 29, 197-207.
Micheli A., Mugno E., Krogh V., et al (2002) Cancer prevalence in European registry areas. Ann Oncol, 13, 840-865.
SEER (2005) Overview of cancer prevalence statistics. Available at: http://srab.cancer.gov/prevalence/, accessed
http://sizegenetics-reviewx.tumblr.com/
<< Home
