AI-ఆధారిత పరిష్కారాలు ప్రభావవంతంగా ఉండటానికి డేటా సెట్లు అవసరం. మరియు ఆ డేటా సెట్ల సృష్టి ఒక క్రమబద్ధమైన స్థాయిలో అవ్యక్త పక్షపాత సమస్యతో నిండి ఉంది. ప్రజలందరూ పక్షపాతంతో బాధపడుతున్నారు (చేతన మరియు అపస్మారక). భౌగోళిక, భాషా, సామాజిక-ఆర్థిక, సెక్సిస్ట్ మరియు జాత్యహంకార: పక్షపాతాలు ఎన్ని రూపాల్లోనైనా ఉండవచ్చు. మరియు ఆ క్రమబద్ధమైన పక్షపాతాలు డేటాలో బేక్ చేయబడతాయి, దీని ఫలితంగా AI ఉత్పత్తులు పక్షపాతాన్ని శాశ్వతంగా పెంచుతాయి మరియు పెంచుతాయి. డేటా సెట్లలో పక్షపాతానికి వ్యతిరేకంగా తగ్గించడానికి సంస్థలకు బుద్ధిపూర్వక విధానం అవసరం.
పక్షపాత సమస్యను వివరించే ఉదాహరణలు
ఈ డేటా సెట్ పక్షపాతానికి ఒక ముఖ్యమైన ఉదాహరణ ఆ సమయంలో చాలా ప్రతికూల ప్రెస్లను సంపాదించింది, ఆడవారి కంటే పురుష అభ్యర్థులకు అనుకూలంగా ఉండే రెజ్యూమ్ రీడింగ్ పరిష్కారం. ఎందుకంటే రిక్రూట్మెంట్ టూల్ డేటా సెట్లు గత దశాబ్దంలో ఎక్కువ మంది దరఖాస్తుదారులు పురుషులే అయినప్పటి నుండి రెజ్యూమ్లను ఉపయోగించి అభివృద్ధి చేయబడ్డాయి. డేటా పక్షపాతంతో ఉంది మరియు ఫలితాలు ఆ పక్షపాతాన్ని ప్రతిబింబిస్తాయి.
విస్తృతంగా నివేదించబడిన మరొక ఉదాహరణ: వార్షిక Google I/O డెవలపర్ కాన్ఫరెన్స్లో, Google వారి చర్మం, జుట్టు మరియు గోళ్లకు సంబంధించిన సమస్యలతో ఏమి జరుగుతుందో అర్థం చేసుకోవడంలో సహాయపడే AI- పవర్డ్ డెర్మటాలజీ సహాయ సాధనం యొక్క ప్రివ్యూను షేర్ చేసింది. డెర్మటాలజీ అసిస్టెంట్ హెల్త్కేర్లో సహాయం చేయడానికి AI ఎలా అభివృద్ధి చెందుతోందో నొక్కి చెబుతుంది - అయితే రంగు ఉన్న వ్యక్తులకు ఈ సాధనం సరిపోదనే విమర్శల నేపథ్యంలో AI లోకి పక్షపాతం వచ్చే సామర్థ్యాన్ని కూడా ఇది హైలైట్ చేసింది.
Google సాధనాన్ని ప్రకటించినప్పుడు, కంపెనీ గుర్తించింది:
మేము ప్రతి ఒక్కరి కోసం నిర్మిస్తున్నామని నిర్ధారించుకోవడానికి, మా మోడల్ వయస్సు, లింగం, జాతి మరియు చర్మ రకాలు వంటి అంశాలను పరిగణనలోకి తీసుకుంటుంది - లేత చర్మం నుండి లేత గోధుమ రంగు చర్మం వరకు అరుదుగా కాలిపోతుంది.
Google, AI ని ఉపయోగించి సాధారణ చర్మ పరిస్థితులకు సమాధానాలు కనుగొనడంలో సహాయపడుతుంది
కానీ వైస్లోని ఒక కథనం గూగుల్ ఒక సమగ్ర డేటా సెట్ను ఉపయోగించడంలో విఫలమైందని చెప్పింది:
పనిని నెరవేర్చడానికి, పరిశోధకులు రెండు రాష్ట్రాల్లో ఉన్న 64,837 మంది రోగుల 12,399 చిత్రాల శిక్షణ డేటాసెట్ను ఉపయోగించారు. చిత్రించిన వేలాది చర్మ పరిస్థితులలో, కేవలం 3.5 శాతం మంది ఫిట్జ్పాట్రిక్ స్కిన్ రకాలు V మరియు VI- నుండి వరుసగా గోధుమ చర్మం మరియు ముదురు గోధుమ లేదా నలుపు చర్మానికి ప్రాతినిధ్యం వహిస్తున్నారు. డేటాబేస్లో 90 శాతం మంది చర్మం, ముదురు తెల్లని చర్మం లేదా లేత గోధుమ రంగు చర్మం కలిగిన వ్యక్తులతో కూడి ఉంటుంది. పక్షపాత నమూనా ఫలితంగా, చర్మవ్యాధి నిపుణులు ఈ యాప్ తెల్లగా లేని వ్యక్తులను అతిగా లేదా తక్కువ నిర్ధారణకు దారితీస్తుందని చెప్పారు.
వైస్, Google యొక్క కొత్త డెర్మటాలజీ యాప్ ముదురు రంగు చర్మం కలిగిన వ్యక్తుల కోసం రూపొందించబడలేదు
సాధనాన్ని అధికారికంగా విడుదల చేయడానికి ముందు దాన్ని మెరుగుపరుస్తామని గూగుల్ స్పందించింది:
మా AI-ఆధారిత డెర్మటాలజీ సహాయ సాధనం మూడు సంవత్సరాల కంటే ఎక్కువ పరిశోధనల ముగింపు. మా పని నేచర్ మెడిసిన్లో ప్రదర్శించబడినందున, వేలాది మంది వ్యక్తులు విరాళంగా ఇచ్చిన డేటా మరియు మిలియన్ల కొద్దీ క్యూరేటెడ్ చర్మ సంబంధిత చిత్రాలను కలిగి ఉన్న అదనపు డేటాసెట్ల విలీనంతో మేము మా సాంకేతికతను అభివృద్ధి చేయడం మరియు మెరుగుపరచడం కొనసాగించాము.
Google, AI ని ఉపయోగించి సాధారణ చర్మ పరిస్థితులకు సమాధానాలు కనుగొనడంలో సహాయపడుతుంది
AI మరియు మెషిన్ లెర్నింగ్ ప్రోగ్రామ్లు ఈ పక్షపాతాలను సరిచేయగలవని మేము ఆశించినంతవరకు, వాస్తవికత అలాగే ఉంది: అవి అలాగే ఉన్నాయి స్మార్ట్ వారి డేటా సెట్లు శుభ్రంగా ఉంటాయి. పాత ప్రోగ్రామింగ్ సామెతకు నవీకరణలో చెత్తలో/చెత్త బయటకు, AI పరిష్కారాలు గెట్-గో నుండి వాటి డేటా సెట్ల నాణ్యత మాత్రమే బలంగా ఉంటాయి. ప్రోగ్రామర్ల నుండి దిద్దుబాటు లేకుండా, ఈ డేటా సెట్లు తమను తాము పరిష్కరించుకునే నేపథ్య అనుభవాన్ని కలిగి ఉండవు - ఎందుకంటే వాటికి వేరే ఫ్రేమ్ ఆఫ్ రిఫరెన్స్ లేదు.
బాధ్యతాయుతంగా డేటా సెట్లను రూపొందించడం అన్నింటిలో ప్రధానమైనది నైతిక కృత్రిమ మేధస్సు. మరియు ప్రజలు పరిష్కారం యొక్క ప్రధాన భాగంలో ఉన్నారు.
మైండ్ఫుల్ AI అనేది నైతిక AI
పక్షపాతం శూన్యంలో జరగదు. అనైతిక లేదా పక్షపాత డేటా సెట్లు అభివృద్ధి దశలో తప్పుడు విధానాన్ని తీసుకోవడం వలన వస్తాయి. బయాస్ లోపాలను ఎదుర్కోవడానికి మార్గం ఏమిటంటే, పరిశ్రమలోని చాలా మంది మైండ్ఫుల్ AI అని పిలుస్తున్న బాధ్యతాయుతమైన, మానవ-కేంద్రీకృత విధానాన్ని అవలంబించడం. మైండ్ఫుల్ AI మూడు ముఖ్యమైన భాగాలను కలిగి ఉంది:
1. మైండ్ఫుల్ AI అనేది మానవ-కేంద్రీకృతమైనది
AI ప్రాజెక్ట్ ప్రారంభం నుండి, ప్రణాళికా దశలలో, ప్రజల అవసరాలు ప్రతి నిర్ణయానికి కేంద్రంగా ఉండాలి. మరియు ప్రజలందరూ అంటే - కేవలం ఉపసమితి మాత్రమే కాదు. అందుకే డెవలపర్లు AI అప్లికేషన్లను కలుపుకొని మరియు పక్షపాత రహితంగా ఉండటానికి శిక్షణ ఇవ్వడానికి ప్రపంచవ్యాప్తంగా ఉన్న వ్యక్తుల విభిన్న బృందంపై ఆధారపడాలి.
గ్లోబల్, విభిన్న బృందం నుండి డేటా సెట్లను క్రౌడ్సోర్సింగ్ చేయడం వలన పక్షపాతాలు ముందుగా గుర్తించబడి, ఫిల్టర్ చేయబడి ఉంటాయి. విభిన్న జాతులు, వయస్సు వర్గాలు, లింగాలు, విద్యా స్థాయిలు, సామాజిక-ఆర్థిక నేపథ్యాలు మరియు స్థానాలు ఉన్నవారు ఒకదానికొకటి విలువలకు అనుకూలంగా ఉండే డేటా సెట్లను సులభంగా గుర్తించవచ్చు, తద్వారా అనాలోచిత పక్షపాతాన్ని తొలగిస్తారు.
వాయిస్ అప్లికేషన్లను పరిశీలించండి. బుద్ధిపూర్వక AI విధానాన్ని వర్తింపజేసేటప్పుడు మరియు గ్లోబల్ టాలెంట్ పూల్ యొక్క శక్తిని ఉపయోగించినప్పుడు, డెవలపర్లు డేటా సెట్లలోని విభిన్న మాండలికాలు మరియు స్వరాలు వంటి భాషాపరమైన అంశాలను పరిగణనలోకి తీసుకోవచ్చు.
మొదటి నుండి మానవ-కేంద్రీకృత డిజైన్ ఫ్రేమ్వర్క్ను ఏర్పాటు చేయడం చాలా కీలకం. ఉత్పత్తి చేయబడిన, క్యూరేటెడ్ మరియు లేబుల్ చేయబడిన డేటా తుది వినియోగదారుల అంచనాలకు అనుగుణంగా ఉండేలా చూసుకోవడానికి ఇది చాలా దూరం వెళుతుంది. మొత్తం ఉత్పత్తి అభివృద్ధి జీవితచక్రం అంతటా మనుషులను లూప్లో ఉంచడం కూడా చాలా ముఖ్యం.
లూప్లోని మానవులు ప్రతి నిర్దిష్ట ప్రేక్షకులకు మెరుగైన AI అనుభవాన్ని సృష్టించడంలో యంత్రాలకు కూడా సహాయపడగలరు. Pactera EDGE లో, ప్రపంచవ్యాప్తంగా ఉన్న మా AI డేటా ప్రాజెక్ట్ బృందాలు, విభిన్న సంస్కృతులు మరియు సందర్భాలు విశ్వసనీయ AI శిక్షణ డేటా సేకరణ మరియు క్యూరేషన్ని ఎలా ప్రభావితం చేస్తాయో అర్థం చేసుకుంటాయి. సమస్యలను ఫ్లాగ్ చేయడానికి, వాటిని పర్యవేక్షించడానికి మరియు AI- ఆధారిత పరిష్కారం ప్రత్యక్ష ప్రసారం కావడానికి ముందు వాటిని పరిష్కరించడానికి అవసరమైన సాధనాలు వారి వద్ద ఉన్నాయి.
హ్యూమన్-ఇన్-ది-లూప్ AI అనేది ప్రాజెక్ట్ "సేఫ్టీ నెట్", ఇది వ్యక్తుల బలాలను మిళితం చేస్తుంది-మరియు వారి విభిన్న నేపథ్యాలు యంత్రాల వేగవంతమైన కంప్యూటింగ్ శక్తితో. ఈ మానవ మరియు AI సహకారాన్ని ప్రోగ్రామ్ల ప్రారంభం నుండి ఏర్పాటు చేయాలి, తద్వారా పక్షపాత డేటా ప్రాజెక్ట్లో పునాదిని ఏర్పరచదు.
2. మైండ్ఫుల్ AI బాధ్యత వహిస్తుంది
బాధ్యతాయుతంగా ఉండటం అంటే AI వ్యవస్థలు పక్షపాతం లేకుండా ఉండేలా మరియు అవి నైతికతపై ఆధారపడి ఉన్నాయని నిర్ధారించడం. డేటా ఎలా, ఎందుకు మరియు ఎక్కడ సృష్టించబడుతుందో, AI సిస్టమ్ల ద్వారా ఇది ఎలా సంశ్లేషణ చేయబడుతుంది మరియు నిర్ణయం తీసుకోవడంలో నైతికపరమైన చిక్కులను కలిగి ఉండే నిర్ణయాలను ఎలా ఉపయోగించాలి అనే దాని గురించి ఇది జాగ్రత్త వహించడం. వ్యాపారం చేయడానికి ఒక మార్గం ఏమిటంటే, తక్కువ ప్రాతినిధ్యం లేని కమ్యూనిటీలతో మరింత కలుపుకొని మరియు తక్కువ పక్షపాతంతో పని చేయడం. డేటా ఉల్లేఖనాల రంగంలో, ప్రతి ఉల్లేఖన లేబుల్లను ప్రత్యేక సబ్టాస్క్గా పరిగణించే బహుళ-ఉల్లేఖన మల్టీ-టాస్క్ మోడల్ విలక్షణమైన గ్రౌండ్ ట్రూత్ మెథడ్స్లో అంతర్లీనంగా ఉన్న సంభావ్య సమస్యలను ఎలా తగ్గించడంలో సహాయపడగలదో కొత్త పరిశోధన హైలైట్ చేస్తోంది. ఒకే గ్రౌండ్ సత్యానికి ఉల్లేఖనాల సంకలనం లో విస్మరించబడవచ్చు.
3. నమ్మదగినది
వ్యాపారం పారదర్శకంగా మరియు AI మోడల్కి ఎలా శిక్షణ ఇవ్వబడింది, అది ఎలా పనిచేస్తుంది మరియు ఫలితాలను ఎందుకు సిఫార్సు చేస్తుందనేది వివరించదగినది. ఒక వ్యాపారానికి AI స్థానికీకరణతో నైపుణ్యం అవసరం, దాని క్లయింట్లు వారి AI అప్లికేషన్లను మరింత కలుపుకొని మరియు వ్యక్తిగతీకరించడం సాధ్యమవుతుంది, స్థానిక భాషలో క్లిష్టమైన సూక్ష్మ నైపుణ్యాలను మరియు ఒక దేశం నుండి మరొక దేశానికి AI పరిష్కారం యొక్క విశ్వసనీయతను సృష్టించగల లేదా విచ్ఛిన్నం చేయగల వినియోగదారు అనుభవాలను గౌరవిస్తుంది. . ఉదాహరణకు, వాయిస్ ఆధారిత అప్లికేషన్లలో భాషలు, మాండలికాలు మరియు ఉచ్చారణలతో సహా వ్యక్తిగతీకరించిన మరియు స్థానికీకరించిన సందర్భాల కోసం వ్యాపారం దాని అప్లికేషన్లను రూపొందించాలి. ఆ విధంగా, ఒక యాప్ ఇంగ్లీషు నుండి తక్కువ ప్రాతినిధ్యం వహించే భాషల వరకు ప్రతి భాషకు ఒకే స్థాయి వాయిస్ అనుభవ అధునాతనతను అందిస్తుంది.
సరసత మరియు వైవిధ్యం
అంతిమంగా, నిర్దిష్ట ఫలితాల యొక్క పరిణామాలు మరియు ప్రభావం మార్కెట్లోకి వెళ్లే ముందు పర్యవేక్షించబడే మరియు మూల్యాంకనం చేయబడే సరసమైన మరియు విభిన్న డేటా సెట్లపై పరిష్కారాలు నిర్మించబడతాయని AI నిర్ధారిస్తుంది. పరిష్కారం యొక్క అభివృద్ధిలో ప్రతి భాగంలో జాగ్రత్త వహించడం మరియు మనుషులను చేర్చడం ద్వారా, AI నమూనాలు శుభ్రంగా, కనిష్టంగా పక్షపాతంగా మరియు సాధ్యమైనంత వరకు నైతికంగా ఉండేలా చూసుకోవడానికి మేము సహాయం చేస్తాము.