Како преземањето внимателен пристап кон вештачката интелигенција ги намалува пристрасните групи на податоци

Пристрасни збирки на податоци и етичка вештачка интелигенција

На решенијата со вештачка интелигенција им требаат збирки на податоци за да бидат ефективни. И креирањето на тие множества податоци е полн со имплицитен проблем на пристрасност на систематско ниво. Сите луѓе страдаат од предрасуди (и свесни и несвесни). Предрасудите можат да имаат повеќе форми: географски, јазични, социо-економски, сексистички и расистички. И тие систематски пристрасности се печат во податоци, што може да резултира со производи од вештачка интелигенција кои ја овековечуваат и ја зголемуваат пристрасноста. На организациите им е потребен внимателен пристап за да се ублажи пристрасноста во сетови на податоци.

Примери кои го илустрираат проблемот на пристрасност

Еден значаен пример за оваа пристрасност на збирот на податоци што собра многу негативен печат во тоа време беше решението за читање резиме кое ги фаворизираше машките кандидати пред женските. Тоа е затоа што збирките на податоци на алатката за регрутирање беа развиени користејќи резимеа од изминатата деценија кога мнозинството апликанти беа мажи. Податоците беа пристрасни и резултатите ја рефлектираа таа пристрасност. 

Друг широко пријавен пример: на годишната конференција за програмери на Google I/O, Google сподели преглед на алатка за помош за дерматологија напојувана со вештачка интелигенција која им помага на луѓето да разберат што се случува со проблемите поврзани со нивната кожа, коса и нокти. Асистентот за дерматологија нагласува како вештачката интелигенција се развива за да помогне во здравствената заштита - но исто така го истакна потенцијалот за пристрасност да навлезе во вештачката интелигенција по критиките дека алатката не е соодветна за луѓе со боја.

Кога Google ја објави алатката, компанијата забележа:

За да бидеме сигурни дека градиме за секого, нашиот модел ги зема предвид факторите како возраста, полот, расата и типот на кожа - од бледа кожа што не потемнува до кафена кожа што ретко гори.

Гугл, користи вештачка интелигенција за да помогне да се најдат одговори на вообичаените кожни заболувања

Но, една статија во Vice вели дека Google не успеал да користи инклузивен сет на податоци:

За да ја постигнат задачата, истражувачите користеа база на податоци за обука од 64,837 слики од 12,399 пациенти лоцирани во две држави. Но, од илјадниците кожни состојби на сликата, само 3.5 проценти потекнуваат од пациенти со типови V и VI на кожа Фицпатрик - оние што претставуваат кафеава кожа и темно кафеава или црна кожа, соодветно. Според студијата, 90 проценти од базата на податоци била составена од луѓе со светла кожа, потемна бела или светло-кафеава кожа. Како резултат на пристрасното земање примероци, дерматолозите велат дека апликацијата може да заврши прекумерно или недоволно дијагностицирање на луѓе кои не се бели.

Заменик, новата апликација за дерматологија на Google не беше наменета за луѓе со потемна кожа

Google одговори со тоа што рече дека ќе ја усоврши алатката пред официјално да ја објави:

Нашата алатка за помош за дерматологија напојувана со вештачка интелигенција е кулминација на повеќе од три години истражување. Откако нашата работа беше претставена во Nature Medicine, продолживме да ја развиваме и усовршуваме нашата технологија со инкорпорирање на дополнителни збирки на податоци кои вклучуваат податоци донирани од илјадници луѓе и милиони други курирани слики од грижата за кожата.

Гугл, користи вештачка интелигенција за да помогне да се најдат одговори на вообичаените кожни заболувања

Колку и да се надеваме дека програмите за вештачка интелигенција и машинско учење би можеле да ги поправат овие предрасуди, реалноста останува: тие се само како паметни бидејќи нивните збирки на податоци се чисти. Во ажурирање на старата програмска поговорка ѓубре во / ѓубре надвор, Решенијата за вештачка интелигенција се исто толку силни колку и квалитетот на нивните сетови на податоци од самиот почеток. Без корекција од програмерите, овие збирки на податоци немаат искуство во позадина за да се поправат - бидејќи едноставно немаат друга референтна рамка.

Во сржта на сите е одговорното градење на збирки податоци етичка вештачка интелигенцијаНа А луѓето се во суштината на решението. 

Внимателната вештачка интелигенција е етичка вештачка интелигенција

Пристрасноста не се случува во вакуум. Неетичките или пристрасни збирки на податоци доаѓаат од преземањето погрешен пристап во фазата на развој. Начинот за борба против грешките во пристрасноста е да се усвои одговорен, човекоцентричен пристап, кој многумина во индустријата го нарекуваат Mindful AI. Внимателната вештачка интелигенција има три критични компоненти:

1. Внимателната вештачка интелигенција е насочена кон човекот

Од почетокот на проектот за вештачка интелигенција, во фазите на планирање, потребите на луѓето мора да бидат во центарот на секоја одлука. И тоа значи дека сите луѓе - не само подмножество. Затоа програмерите треба да се потпрат на разновиден тим од луѓе со седиште на глобално ниво за да ги обучуваат апликациите за вештачка интелигенција да бидат инклузивни и без пристрасност.

Спојувањето на збирките на податоци од глобален, разновиден тим обезбедува предрасуди да се идентификуваат и филтрираат рано. Оние од различна етничка припадност, возрасни групи, пол, ниво на образование, социо-економско потекло и локации можат полесно да забележат збирки на податоци кои фаворизираат еден збир на вредности пред друг, со што се отстранува ненамерната пристрасност.

Погледнете ги гласовните апликации. При примена на внимателен пристап за вештачка интелигенција и искористување на моќта на глобалниот базен на таленти, програмерите можат да ги земат предвид јазичните елементи како што се различните дијалекти и акценти во збирките на податоци.

Воспоставувањето рамка за дизајн наменета за човекот од почеток е критична. Тоа оди долг пат кон обезбедување дека податоците генерирани, курирани и етикетирани ги исполнуваат очекувањата на крајните корисници. Но, исто така, важно е луѓето да бидат во тек во текот на целиот животен циклус на развој на производот. 

Луѓето во циклусот, исто така, можат да им помогнат на машините да создадат подобро искуство со вештачка интелигенција за секоја специфична публика. Во Pactera EDGE, нашите проектни тимови за податоци за вештачка интелигенција, лоцирани на глобално ниво, разбираат како различните култури и контексти можат да влијаат врз собирањето и чувањето на доверливи податоци за обука за вештачка интелигенција. Тие ги имаат потребните алатки што им се потребни за да ги означат проблемите, да ги следат и да ги поправат пред решението засновано на вештачка интелигенција да започне во употреба.

Вештачката интелигенција Human-in-the-loop е проект „безбедносна мрежа“ што ги комбинира силните страни на луѓето - и нивното различно потекло со брзата компјутерска моќ на машините. Оваа соработка меѓу луѓето и вештачката интелигенција треба да се воспостави уште од почетокот на програмите, така што пристрасните податоци не формираат основа во проектот. 

2. Внимателната вештачка интелигенција е одговорна

Да се ​​биде одговорен е да се осигури дека системите за вештачка интелигенција немаат предрасуди и дека се засновани на етика. Се работи за тоа како, зошто и каде се создаваат податоците, како се синтетизираат од системите за вештачка интелигенција и како се користат при донесување одлука, одлуки кои можат да имаат етички импликации. Еден начин да го стори тоа бизнисот е да работи со недоволно застапените заедници за да биде поинклузивен и помалку пристрасен. На полето на прибелешките на податоците, новото истражување нагласува како моделот со повеќе задачи со повеќе анотатори кој ги третира етикетите на секој анотатор како посебна подзадача може да помогне во ублажувањето на потенцијалните проблеми својствени за типичните методи на основна вистина, каде што несогласувањата на прибележувачите може да се должат на недоволно претставување и може да се игнорира во збирот на прибелешки на една основа вистина. 

3. Доверлив

Доверливоста доаѓа од тоа што бизнисот е транспарентен и објаснет во тоа како се обучува моделот на вештачка интелигенција, како функционира и зошто ги препорачуваат резултатите. На бизнисот му е потребна експертиза со локализација на вештачката интелигенција за да им овозможи на своите клиенти да ги направат своите апликации за вештачка интелигенција поинклузивни и персонализирани, почитувајќи ги критичните нијанси во локалниот јазик и корисничките искуства кои можат да го направат или да го нарушат кредибилитетот на решението за вештачка интелигенција од една земја во друга. . На пример, бизнисот треба да ги дизајнира своите апликации за персонализирани и локализирани контексти, вклучувајќи јазици, дијалекти и акценти во апликациите базирани на глас. На тој начин, апликацијата носи исто ниво на софистицираност на гласовно искуство на секој јазик, од англиски до недоволно застапени јазици.

Праведност и различност

На крајот на краиштата, внимателната вештачка интелигенција гарантира дека решенијата се изградени врз фер и разновидни збирки на податоци каде што последиците и влијанието на одредени резултати се следат и оценуваат пред решението да излезе на пазарот. Со тоа што сме внимателни и вклучувајќи ги луѓето во секој дел од развојот на решението, помагаме да се осигураме дека моделите со вештачка интелигенција остануваат чисти, минимално пристрасни и што е можно поетички.

Што мислите?

Оваа страница користи Akismet за намалување на спам. Научете како се обработува вашиот коментар.