పక్షపాత డేటా సెట్‌లపై AI కట్‌లను తగ్గించడానికి ఎలా జాగ్రత్త వహించాలి

పక్షపాత డేటాసెట్‌లు మరియు నైతిక AI

AI-ఆధారిత పరిష్కారాలు ప్రభావవంతంగా ఉండటానికి డేటా సెట్‌లు అవసరం. మరియు ఆ డేటా సెట్ల సృష్టి ఒక క్రమబద్ధమైన స్థాయిలో అవ్యక్త పక్షపాత సమస్యతో నిండి ఉంది. ప్రజలందరూ పక్షపాతంతో బాధపడుతున్నారు (చేతన మరియు అపస్మారక). భౌగోళిక, భాషా, సామాజిక-ఆర్థిక, సెక్సిస్ట్ మరియు జాత్యహంకార: పక్షపాతాలు ఎన్ని రూపాల్లోనైనా ఉండవచ్చు. మరియు ఆ క్రమబద్ధమైన పక్షపాతాలు డేటాలో బేక్ చేయబడతాయి, దీని ఫలితంగా AI ఉత్పత్తులు పక్షపాతాన్ని శాశ్వతంగా పెంచుతాయి మరియు పెంచుతాయి. డేటా సెట్‌లలో పక్షపాతానికి వ్యతిరేకంగా తగ్గించడానికి సంస్థలకు బుద్ధిపూర్వక విధానం అవసరం.

పక్షపాత సమస్యను వివరించే ఉదాహరణలు

ఈ డేటా సెట్ పక్షపాతానికి ఒక ముఖ్యమైన ఉదాహరణ ఆ సమయంలో చాలా ప్రతికూల ప్రెస్‌లను సంపాదించింది, ఆడవారి కంటే పురుష అభ్యర్థులకు అనుకూలంగా ఉండే రెజ్యూమ్ రీడింగ్ పరిష్కారం. ఎందుకంటే రిక్రూట్‌మెంట్ టూల్ డేటా సెట్‌లు గత దశాబ్దంలో ఎక్కువ మంది దరఖాస్తుదారులు పురుషులే అయినప్పటి నుండి రెజ్యూమ్‌లను ఉపయోగించి అభివృద్ధి చేయబడ్డాయి. డేటా పక్షపాతంతో ఉంది మరియు ఫలితాలు ఆ పక్షపాతాన్ని ప్రతిబింబిస్తాయి. 

విస్తృతంగా నివేదించబడిన మరొక ఉదాహరణ: వార్షిక Google I/O డెవలపర్ కాన్ఫరెన్స్‌లో, Google వారి చర్మం, జుట్టు మరియు గోళ్లకు సంబంధించిన సమస్యలతో ఏమి జరుగుతుందో అర్థం చేసుకోవడంలో సహాయపడే AI- పవర్డ్ డెర్మటాలజీ సహాయ సాధనం యొక్క ప్రివ్యూను షేర్ చేసింది. డెర్మటాలజీ అసిస్టెంట్ హెల్త్‌కేర్‌లో సహాయం చేయడానికి AI ఎలా అభివృద్ధి చెందుతోందో నొక్కి చెబుతుంది - అయితే రంగు ఉన్న వ్యక్తులకు ఈ సాధనం సరిపోదనే విమర్శల నేపథ్యంలో AI లోకి పక్షపాతం వచ్చే సామర్థ్యాన్ని కూడా ఇది హైలైట్ చేసింది.

Google సాధనాన్ని ప్రకటించినప్పుడు, కంపెనీ గుర్తించింది:

మేము ప్రతి ఒక్కరి కోసం నిర్మిస్తున్నామని నిర్ధారించుకోవడానికి, మా మోడల్ వయస్సు, లింగం, జాతి మరియు చర్మ రకాలు వంటి అంశాలను పరిగణనలోకి తీసుకుంటుంది - లేత చర్మం నుండి లేత గోధుమ రంగు చర్మం వరకు అరుదుగా కాలిపోతుంది.

Google, AI ని ఉపయోగించి సాధారణ చర్మ పరిస్థితులకు సమాధానాలు కనుగొనడంలో సహాయపడుతుంది

కానీ వైస్‌లోని ఒక కథనం గూగుల్ ఒక సమగ్ర డేటా సెట్‌ను ఉపయోగించడంలో విఫలమైందని చెప్పింది:

పనిని నెరవేర్చడానికి, పరిశోధకులు రెండు రాష్ట్రాల్లో ఉన్న 64,837 మంది రోగుల 12,399 చిత్రాల శిక్షణ డేటాసెట్‌ను ఉపయోగించారు. చిత్రించిన వేలాది చర్మ పరిస్థితులలో, కేవలం 3.5 శాతం మంది ఫిట్జ్‌పాట్రిక్ స్కిన్ రకాలు V మరియు VI- నుండి వరుసగా గోధుమ చర్మం మరియు ముదురు గోధుమ లేదా నలుపు చర్మానికి ప్రాతినిధ్యం వహిస్తున్నారు. డేటాబేస్‌లో 90 శాతం మంది చర్మం, ముదురు తెల్లని చర్మం లేదా లేత గోధుమ రంగు చర్మం కలిగిన వ్యక్తులతో కూడి ఉంటుంది. పక్షపాత నమూనా ఫలితంగా, చర్మవ్యాధి నిపుణులు ఈ యాప్ తెల్లగా లేని వ్యక్తులను అతిగా లేదా తక్కువ నిర్ధారణకు దారితీస్తుందని చెప్పారు.

వైస్, Google యొక్క కొత్త డెర్మటాలజీ యాప్ ముదురు రంగు చర్మం కలిగిన వ్యక్తుల కోసం రూపొందించబడలేదు

సాధనాన్ని అధికారికంగా విడుదల చేయడానికి ముందు దాన్ని మెరుగుపరుస్తామని గూగుల్ స్పందించింది:

మా AI-ఆధారిత డెర్మటాలజీ సహాయ సాధనం మూడు సంవత్సరాల కంటే ఎక్కువ పరిశోధనల ముగింపు. మా పని నేచర్ మెడిసిన్‌లో ప్రదర్శించబడినందున, వేలాది మంది వ్యక్తులు విరాళంగా ఇచ్చిన డేటా మరియు మిలియన్ల కొద్దీ క్యూరేటెడ్ చర్మ సంబంధిత చిత్రాలను కలిగి ఉన్న అదనపు డేటాసెట్‌ల విలీనంతో మేము మా సాంకేతికతను అభివృద్ధి చేయడం మరియు మెరుగుపరచడం కొనసాగించాము.

Google, AI ని ఉపయోగించి సాధారణ చర్మ పరిస్థితులకు సమాధానాలు కనుగొనడంలో సహాయపడుతుంది

AI మరియు మెషిన్ లెర్నింగ్ ప్రోగ్రామ్‌లు ఈ పక్షపాతాలను సరిచేయగలవని మేము ఆశించినంతవరకు, వాస్తవికత అలాగే ఉంది: అవి అలాగే ఉన్నాయి స్మార్ట్ వారి డేటా సెట్లు శుభ్రంగా ఉంటాయి. పాత ప్రోగ్రామింగ్ సామెతకు నవీకరణలో చెత్తలో/చెత్త బయటకు, AI పరిష్కారాలు గెట్-గో నుండి వాటి డేటా సెట్‌ల నాణ్యత మాత్రమే బలంగా ఉంటాయి. ప్రోగ్రామర్ల నుండి దిద్దుబాటు లేకుండా, ఈ డేటా సెట్‌లు తమను తాము పరిష్కరించుకునే నేపథ్య అనుభవాన్ని కలిగి ఉండవు - ఎందుకంటే వాటికి వేరే ఫ్రేమ్ ఆఫ్ రిఫరెన్స్ లేదు.

బాధ్యతాయుతంగా డేటా సెట్‌లను రూపొందించడం అన్నింటిలో ప్రధానమైనది నైతిక కృత్రిమ మేధస్సు. మరియు ప్రజలు పరిష్కారం యొక్క ప్రధాన భాగంలో ఉన్నారు. 

మైండ్‌ఫుల్ AI అనేది నైతిక AI

పక్షపాతం శూన్యంలో జరగదు. అనైతిక లేదా పక్షపాత డేటా సెట్‌లు అభివృద్ధి దశలో తప్పుడు విధానాన్ని తీసుకోవడం వలన వస్తాయి. బయాస్ లోపాలను ఎదుర్కోవడానికి మార్గం ఏమిటంటే, పరిశ్రమలోని చాలా మంది మైండ్‌ఫుల్ AI అని పిలుస్తున్న బాధ్యతాయుతమైన, మానవ-కేంద్రీకృత విధానాన్ని అవలంబించడం. మైండ్‌ఫుల్ AI మూడు ముఖ్యమైన భాగాలను కలిగి ఉంది:

1. మైండ్‌ఫుల్ AI అనేది మానవ-కేంద్రీకృతమైనది

AI ప్రాజెక్ట్ ప్రారంభం నుండి, ప్రణాళికా దశలలో, ప్రజల అవసరాలు ప్రతి నిర్ణయానికి కేంద్రంగా ఉండాలి. మరియు ప్రజలందరూ అంటే - కేవలం ఉపసమితి మాత్రమే కాదు. అందుకే డెవలపర్లు AI అప్లికేషన్‌లను కలుపుకొని మరియు పక్షపాత రహితంగా ఉండటానికి శిక్షణ ఇవ్వడానికి ప్రపంచవ్యాప్తంగా ఉన్న వ్యక్తుల విభిన్న బృందంపై ఆధారపడాలి.

గ్లోబల్, విభిన్న బృందం నుండి డేటా సెట్‌లను క్రౌడ్‌సోర్సింగ్ చేయడం వలన పక్షపాతాలు ముందుగా గుర్తించబడి, ఫిల్టర్ చేయబడి ఉంటాయి. విభిన్న జాతులు, వయస్సు వర్గాలు, లింగాలు, విద్యా స్థాయిలు, సామాజిక-ఆర్థిక నేపథ్యాలు మరియు స్థానాలు ఉన్నవారు ఒకదానికొకటి విలువలకు అనుకూలంగా ఉండే డేటా సెట్‌లను సులభంగా గుర్తించవచ్చు, తద్వారా అనాలోచిత పక్షపాతాన్ని తొలగిస్తారు.

వాయిస్ అప్లికేషన్‌లను పరిశీలించండి. బుద్ధిపూర్వక AI విధానాన్ని వర్తింపజేసేటప్పుడు మరియు గ్లోబల్ టాలెంట్ పూల్ యొక్క శక్తిని ఉపయోగించినప్పుడు, డెవలపర్‌లు డేటా సెట్‌లలోని విభిన్న మాండలికాలు మరియు స్వరాలు వంటి భాషాపరమైన అంశాలను పరిగణనలోకి తీసుకోవచ్చు.

మొదటి నుండి మానవ-కేంద్రీకృత డిజైన్ ఫ్రేమ్‌వర్క్‌ను ఏర్పాటు చేయడం చాలా కీలకం. ఉత్పత్తి చేయబడిన, క్యూరేటెడ్ మరియు లేబుల్ చేయబడిన డేటా తుది వినియోగదారుల అంచనాలకు అనుగుణంగా ఉండేలా చూసుకోవడానికి ఇది చాలా దూరం వెళుతుంది. మొత్తం ఉత్పత్తి అభివృద్ధి జీవితచక్రం అంతటా మనుషులను లూప్‌లో ఉంచడం కూడా చాలా ముఖ్యం. 

లూప్‌లోని మానవులు ప్రతి నిర్దిష్ట ప్రేక్షకులకు మెరుగైన AI అనుభవాన్ని సృష్టించడంలో యంత్రాలకు కూడా సహాయపడగలరు. Pactera EDGE లో, ప్రపంచవ్యాప్తంగా ఉన్న మా AI డేటా ప్రాజెక్ట్ బృందాలు, విభిన్న సంస్కృతులు మరియు సందర్భాలు విశ్వసనీయ AI శిక్షణ డేటా సేకరణ మరియు క్యూరేషన్‌ని ఎలా ప్రభావితం చేస్తాయో అర్థం చేసుకుంటాయి. సమస్యలను ఫ్లాగ్ చేయడానికి, వాటిని పర్యవేక్షించడానికి మరియు AI- ఆధారిత పరిష్కారం ప్రత్యక్ష ప్రసారం కావడానికి ముందు వాటిని పరిష్కరించడానికి అవసరమైన సాధనాలు వారి వద్ద ఉన్నాయి.

హ్యూమన్-ఇన్-ది-లూప్ AI అనేది ప్రాజెక్ట్ "సేఫ్టీ నెట్", ఇది వ్యక్తుల బలాలను మిళితం చేస్తుంది-మరియు వారి విభిన్న నేపథ్యాలు యంత్రాల వేగవంతమైన కంప్యూటింగ్ శక్తితో. ఈ మానవ మరియు AI సహకారాన్ని ప్రోగ్రామ్‌ల ప్రారంభం నుండి ఏర్పాటు చేయాలి, తద్వారా పక్షపాత డేటా ప్రాజెక్ట్‌లో పునాదిని ఏర్పరచదు. 

2. మైండ్‌ఫుల్ AI బాధ్యత వహిస్తుంది

బాధ్యతాయుతంగా ఉండటం అంటే AI వ్యవస్థలు పక్షపాతం లేకుండా ఉండేలా మరియు అవి నైతికతపై ఆధారపడి ఉన్నాయని నిర్ధారించడం. డేటా ఎలా, ఎందుకు మరియు ఎక్కడ సృష్టించబడుతుందో, AI సిస్టమ్‌ల ద్వారా ఇది ఎలా సంశ్లేషణ చేయబడుతుంది మరియు నిర్ణయం తీసుకోవడంలో నైతికపరమైన చిక్కులను కలిగి ఉండే నిర్ణయాలను ఎలా ఉపయోగించాలి అనే దాని గురించి ఇది జాగ్రత్త వహించడం. వ్యాపారం చేయడానికి ఒక మార్గం ఏమిటంటే, తక్కువ ప్రాతినిధ్యం లేని కమ్యూనిటీలతో మరింత కలుపుకొని మరియు తక్కువ పక్షపాతంతో పని చేయడం. డేటా ఉల్లేఖనాల రంగంలో, ప్రతి ఉల్లేఖన లేబుల్‌లను ప్రత్యేక సబ్‌టాస్క్‌గా పరిగణించే బహుళ-ఉల్లేఖన మల్టీ-టాస్క్ మోడల్ విలక్షణమైన గ్రౌండ్ ట్రూత్ మెథడ్స్‌లో అంతర్లీనంగా ఉన్న సంభావ్య సమస్యలను ఎలా తగ్గించడంలో సహాయపడగలదో కొత్త పరిశోధన హైలైట్ చేస్తోంది. ఒకే గ్రౌండ్ సత్యానికి ఉల్లేఖనాల సంకలనం లో విస్మరించబడవచ్చు. 

3. నమ్మదగినది

వ్యాపారం పారదర్శకంగా మరియు AI మోడల్‌కి ఎలా శిక్షణ ఇవ్వబడింది, అది ఎలా పనిచేస్తుంది మరియు ఫలితాలను ఎందుకు సిఫార్సు చేస్తుందనేది వివరించదగినది. ఒక వ్యాపారానికి AI స్థానికీకరణతో నైపుణ్యం అవసరం, దాని క్లయింట్లు వారి AI అప్లికేషన్‌లను మరింత కలుపుకొని మరియు వ్యక్తిగతీకరించడం సాధ్యమవుతుంది, స్థానిక భాషలో క్లిష్టమైన సూక్ష్మ నైపుణ్యాలను మరియు ఒక దేశం నుండి మరొక దేశానికి AI పరిష్కారం యొక్క విశ్వసనీయతను సృష్టించగల లేదా విచ్ఛిన్నం చేయగల వినియోగదారు అనుభవాలను గౌరవిస్తుంది. . ఉదాహరణకు, వాయిస్ ఆధారిత అప్లికేషన్‌లలో భాషలు, మాండలికాలు మరియు ఉచ్చారణలతో సహా వ్యక్తిగతీకరించిన మరియు స్థానికీకరించిన సందర్భాల కోసం వ్యాపారం దాని అప్లికేషన్‌లను రూపొందించాలి. ఆ విధంగా, ఒక యాప్ ఇంగ్లీషు నుండి తక్కువ ప్రాతినిధ్యం వహించే భాషల వరకు ప్రతి భాషకు ఒకే స్థాయి వాయిస్ అనుభవ అధునాతనతను అందిస్తుంది.

సరసత మరియు వైవిధ్యం

అంతిమంగా, నిర్దిష్ట ఫలితాల యొక్క పరిణామాలు మరియు ప్రభావం మార్కెట్‌లోకి వెళ్లే ముందు పర్యవేక్షించబడే మరియు మూల్యాంకనం చేయబడే సరసమైన మరియు విభిన్న డేటా సెట్‌లపై పరిష్కారాలు నిర్మించబడతాయని AI నిర్ధారిస్తుంది. పరిష్కారం యొక్క అభివృద్ధిలో ప్రతి భాగంలో జాగ్రత్త వహించడం మరియు మనుషులను చేర్చడం ద్వారా, AI నమూనాలు శుభ్రంగా, కనిష్టంగా పక్షపాతంగా మరియు సాధ్యమైనంత వరకు నైతికంగా ఉండేలా చూసుకోవడానికి మేము సహాయం చేస్తాము.

మీరు ఏమి ఆలోచిస్తాడు?

స్పామ్ తగ్గించడానికి ఈ సైట్ Akismet ను ఉపయోగిస్తుంది. మీ వ్యాఖ్య డేటా ఎలా ప్రాసెస్ చేయబడిందో తెలుసుకోండి.