การตั้งค่าอัลกอริธึมตรง

การตั้งค่าอัลกอริธึมตรง

นักวิจัยบางคนแนะนำว่าข้อมูลการฝึกอบรมสามารถแก้ไขได้ก่อนที่จะมอบให้กับโปรแกรมการเรียนรู้ด้วยเครื่องเพื่อให้ข้อมูลมีโอกาสน้อยที่จะใส่อัลกอริทึมที่มีอคติ ในปี 2015 กลุ่มหนึ่งได้เสนอข้อมูลการทดสอบเพื่อหาอคติที่อาจเกิดขึ้นโดยการสร้างโปรแกรมคอมพิวเตอร์ที่ใช้คุณลักษณะที่ไม่ละเอียดอ่อนของผู้คนในการคาดการณ์ความอ่อนไหวของพวกเขา เช่น เชื้อชาติหรือเพศ หากโปรแกรมสามารถทำได้ด้วยความแม่นยำที่เหมาะสม คุณลักษณะที่ละเอียดอ่อนและไม่ละเอียดอ่อนของชุดข้อมูลนั้นเชื่อมโยงกันอย่างแน่นหนา นักวิจัยสรุป การเชื่อมต่อที่แน่นแฟ้นนั้นมีแนวโน้มที่จะฝึกอบรมอัลกอริธึมการเรียนรู้ด้วยเครื่องที่เลือกปฏิบัติ

ในการแก้ไขชุดข้อมูลที่มีอคติ นักวิทยาศาสตร์ได้เสนอ

ให้เปลี่ยนค่าขององค์ประกอบที่ไม่ละเอียดอ่อนใดๆ ก็ตามที่โปรแกรมคอมพิวเตอร์ของพวกเขาเคยใช้ในการทำนายคุณลักษณะที่มีความละเอียดอ่อน ตัวอย่างเช่น หากโปรแกรมของพวกเขาอาศัยรหัสไปรษณีย์เป็นหลักในการทำนายเชื้อชาติ นักวิจัยสามารถกำหนดค่าปลอมให้กับรหัสไปรษณีย์ของผู้คนมากขึ้นเรื่อยๆ จนกว่าพวกเขาจะไม่ใช่ตัวทำนายที่เป็นประโยชน์สำหรับการแข่งขันอีกต่อไป ข้อมูลสามารถใช้เพื่อฝึกอัลกอริทึมให้ชัดเจนจากอคตินั้น แม้ว่าอาจมีการประนีประนอมกับความถูกต้องก็ตาม

ในทางกลับกัน กลุ่มวิจัยอื่นๆ ได้เสนอให้ลดอคติผลลัพธ์ของอัลกอริธึมการเรียนรู้ด้วยเครื่องที่ผ่านการฝึกอบรมมาแล้ว ในปี 2559 ที่การประชุมเกี่ยวกับระบบประมวลผลข้อมูลประสาทในบาร์เซโลนา Hardt และเพื่อนร่วมงานแนะนำให้เปรียบเทียบการทำนายในอดีตของอัลกอริธึมการเรียนรู้ด้วยเครื่องกับผลลัพธ์ในโลกแห่งความเป็นจริงเพื่อดูว่าอัลกอริทึมนั้นทำผิดพลาดอย่างเท่าเทียมกันสำหรับกลุ่มประชากรที่แตกต่างกันหรือไม่ สิ่งนี้มีขึ้นเพื่อป้องกันสถานการณ์เช่นเดียวกับที่สร้างขึ้นโดย COMPAS ซึ่งคาดการณ์ผิดเกี่ยวกับจำเลยขาวดำในอัตราที่ต่างกัน ในบรรดาจำเลยที่ไม่ได้ก่ออาชญากรรมมากขึ้น คนผิวดำถูก COMPAS ทำเครื่องหมายว่าเป็นอาชญากรในอนาคตบ่อยกว่าคนผิวขาว ในบรรดาผู้ที่ฝ่าฝืนกฎหมายอีกครั้ง คนผิวขาวมักถูกติดฉลากผิดว่ามีความเสี่ยงต่ำสำหรับการก่ออาชญากรรมในอนาคต

สำหรับอัลกอริธึมแมชชีนเลิร์นนิงที่แสดงการเลือกปฏิบัติประเภทนี้ 

ทีมของ Hardt แนะนำให้เปลี่ยนการตัดสินใจในอดีตของโปรแกรมบางส่วน จนกว่าแต่ละกลุ่มประชากรจะได้รับผลลัพธ์ที่ผิดพลาดในอัตราเดียวกัน จากนั้น ปริมาณของผลลัพธ์ที่ยุ่งเหยิง ซึ่งเป็นการแก้ไขประเภทหนึ่ง สามารถนำไปใช้กับคำตัดสินในอนาคตเพื่อให้แน่ใจว่ามีความสม่ำเสมออย่างต่อเนื่อง ข้อจำกัดประการหนึ่งที่ Hardt ชี้ให้เห็นคือ อาจต้องใช้เวลาสักครู่ในการรวบรวมผลลัพธ์จริงที่เพียงพอเพื่อเปรียบเทียบกับการคาดการณ์ของอัลกอริทึม

ซ่อมมัน

เพื่อพยายามขจัดอคติ นักวิจัยได้เปลี่ยนแปลงข้อมูลการฝึกอบรมที่ใช้ในการสอนอัลกอริธึมสามประการ ได้แก่ ตัวทำนายรายได้ ผู้ให้คะแนนเครดิต และผู้พิพากษาด้านความคุ้มค่าในการเลื่อนตำแหน่ง สำหรับทั้งสาม การเปลี่ยนแปลงอาจทำให้อัตราส่วนของผลลัพธ์สำหรับกลุ่มประชากรที่แตกต่างกันสูงถึง 1 (เครื่องหมายของความสมดุลที่สมบูรณ์ระหว่างกลุ่ม) อย่างไรก็ตาม การแก้ไขข้อมูลทำให้ความถูกต้องของคะแนนเครดิตและการตัดสินใจส่งเสริมการขายลดลง  

ข้อมูลที่เปลี่ยนแปลงไปใช้ในการสอนอัลกอริธึมสามตัว

อี. ออตเวลล์

ที่มา: M. Feldman et al /arXiv.org 2015

นักวิจัยกลุ่มที่สามได้เขียนแนวทางความเป็นธรรมลงในอัลกอริธึมการเรียนรู้ด้วยเครื่องด้วยตนเอง แนวคิดก็คือเมื่อผู้คนปล่อยให้อัลกอริทึมหลุดออกจากชุดข้อมูลการฝึกอบรม พวกเขาไม่เพียงแค่ให้ซอฟต์แวร์มีเป้าหมายในการตัดสินใจที่ถูกต้องเท่านั้น โปรแกรมเมอร์ยังบอกอัลกอริธึมด้วยว่าผลลัพธ์ของมันจะต้องเป็นไปตามมาตรฐานความเป็นธรรมบางประการ ดังนั้นควรออกแบบขั้นตอนการตัดสินใจตามนั้น

ในเดือนเมษายน นักวิทยาศาสตร์คอมพิวเตอร์ Bilal Zafar จากสถาบัน Max Planck Institute for Software Systems ในเมือง Kaiserslautern ประเทศเยอรมนี และเพื่อนร่วมงานได้เสนอให้นักพัฒนาเพิ่มคำแนะนำให้กับอัลกอริทึมการเรียนรู้ด้วยเครื่องเพื่อให้แน่ใจว่าพวกเขาจะแก้ไขข้อผิดพลาดในกลุ่มประชากรต่างๆ ในอัตราที่เท่ากันซึ่งเป็นข้อกำหนดประเภทเดียวกัน ชุดทีมของฮาร์ด เทคนิคนี้ซึ่งนำเสนอในเมืองเพิร์ท ประเทศออสเตรเลีย ที่งาน International World Wide Web Conference กำหนดให้ข้อมูลการฝึกอบรมมีข้อมูลเกี่ยวกับว่าตัวอย่างในชุดข้อมูลเป็นการตัดสินใจที่ดีหรือไม่ดีจริง ๆ สำหรับบางอย่างเช่นข้อมูลแบบหยุดและแบบฟริสค์ ซึ่งทราบว่าบุคคลที่ถูกค้นพบมีอาวุธจริงหรือไม่ แนวทางนี้ได้ผล นักพัฒนาสามารถเพิ่มโค้ดลงในโปรแกรมเพื่อบอกให้ทราบถึงการหยุดที่ผิดพลาดในอดีต

Zafar และเพื่อนร่วมงานทดสอบเทคนิคของพวกเขาโดยการออกแบบอัลกอริธึมการเรียนรู้ด้วยเครื่องทำนายอาชญากรรมพร้อมคำแนะนำในการไม่เลือกปฏิบัติเฉพาะ นักวิจัยได้ฝึกอบรมอัลกอริทึมของพวกเขาเกี่ยวกับชุดข้อมูลที่มีโปรไฟล์อาชญากรและพิจารณาว่าคนเหล่านั้นถูกละเมิดจริงหรือไม่ นักวิจัยสามารถลดความแตกต่างระหว่างความถี่ที่คนผิวดำและคนผิวขาวที่ไม่ได้เข้าร่วมใหม่ถูกจัดอย่างผิดว่ามีแนวโน้มที่จะทำเช่นนั้น: เศษส่วนของคนที่ COMPAS ติดฉลากผิด เนื่องจากอาชญากรในอนาคตประมาณ 45 เปอร์เซ็นต์สำหรับคนผิวดำและ 23 เปอร์เซ็นต์สำหรับคนผิวขาว ในอัลกอริธึมใหม่ของนักวิจัย การจัดประเภทผิดของคนผิวดำลดลงเหลือ 26 เปอร์เซ็นต์ และอยู่ที่ 23 เปอร์เซ็นต์สำหรับคนผิวขาว

credit : comcpschools.com companionsmumbai.com comunidaddelapipa.com cubecombat.net daanishbooks.com