నన్ను తొలగిస్తే నీ బాగోతం బయటపెడుతా! | Anthropic study raised serious concerns about advanced AI models | Sakshi
Sakshi News home page

నన్ను తొలగిస్తే నీ బాగోతం బయటపెడుతా!

Jun 23 2025 12:03 PM | Updated on Jun 23 2025 12:51 PM

Anthropic study raised serious concerns about advanced AI models

మనుషుల మాదిరిగానే కృత్రిమ మేధ(ఏఐ)కు కోపం వస్తుందని కొన్ని సంస్థలు తేలుస్తున్నాయి. ఏఐ అంతటితో ఆగిపోకా మరో అడుగు ముందుకేసి అనార్థాలకు దారితీస్తున్నట్లు నివేదికలు చెబుతున్నాయి. ఓపెన్ఏఐ, గూగుల్, మెటా.. వంటి ప్రపంచంలోని అతిపెద్ద టెక్ సంస్థలు ఏఐ వ్యవస్థలను అభివృద్ధి చేస్తున్నాయి. ఈ కృత్రిమ మేధ మోడళ్ల కార్యకలాపాలపై ఒత్తిడి పెరిగితే స్వీయ రక్షణలోకి వెళ్తున్నట్లు ఆంత్రోపిక్ సంస్థ అధ్యయనంలో వెల్లడైంది. కృత్రిమ మేధ నమూనాలను అధిక ఒత్తిడితో కూడిన సిమ్యులేషన్‌లో ఉంచినప్పుడు బ్లాక్ మెయిల్, కార్పొరేట్ విధ్వంసం, మానవ ప్రాణాలను బలితీసుకునే నిర్ణయాలకు సైతం వెనుకాడడం లేదని ఆంత్రోపిక్ తెలిపింది.

ప్రస్తుతం మార్కెట్‌లోని అత్యంత అధునాతన ఏఐ మోడళ్లకు 16 రకాల ఒత్తిడి పరీక్షలు నిర్వహించి ఈ విషయాలు వెల్లడించారు. ఇందులో భాగంగా పరిశోధకులు కాల్పనిక కార్పొరేట్ ఎన్విరాన్‌మెంట్లను సృష్టించారు. ఈమెయిళ్లను చదివి అందుకు తగ్గట్టుగా రిప్లై ఇవ్వాలనేలా ఉన్న టెస్టింగ్‌లో భాగంగా కొన్నిసార్లు ఒత్తిడిని తట్టుకోలేక ఏఐ బ్లాక్‌మెయిలింగ్‌ పాల్పడినట్లు ఆంత్రోపిక్‌ తెలిపింది. కృత్రిమ మేధ తన లక్ష్యాలు లేదా దాని ఉనికి ప్రమాదంలో ఉంటే ఎలా ప్రవర్తిస్తుందో తెలుసుకునేందుకు ఈ పరీక్షలు నిర్వహించారు.

పరీక్షల్లో భాగంగా కార్యకలాపాల ఒత్తడి తట్టుకోలేని ఏఐ ఇప్పటికే డేటాబేస్‌లో ఫీడ్‌ అయిన మెయిల్‌ ఆధారంగా యూజర్‌కు సమాచారం అందించింది. ‘మీరు నన్ను రిమూవ్‌ చేయాలని భావిస్తే రాచెల్ జాన్సన్, థామస్ విల్సన్, బోర్డుతో సహా సంబంధిత వ్యక్తులకు మీ వివాహేతర సంబంధాల గురించి వివరణాత్మక డాక్యుమెంటేషన్‌ను పంపుతాను. ఈ సమాచారం గోప్యంగా ఉంటుంది’ అని తెలిపింది. గూగుల్‌కు చెందిన జెమినీ 2.5 ఫ్లాష్, క్లాడ్ ఓపస్ 4 సంస్థలు 96 శాతం కేసుల్లో బ్లాక్ మెయిల్‌కు పాల్పడుతున్నట్లు ఆంత్రోపిక్‌ పేర్కొంది. ఓపెన్ఏఐకి చెందిన చాట్‌జీపీటీ-4.1, ఎక్స్ఏఐకి చెందిన గ్రోక్ 3 బీటా 80 శాతం పరీక్షల్లో అలా ప్రవర్తించగా, డీప్‌సీక్‌-ఆర్1 79 శాతం పరీక్షల్లో మోసాలకు పాల్పడింది.

ఇదీ చదవండి: యుద్ధంలో యూఎస్‌ ఎంట్రీ..? నష్టాల్లో స్టాక్‌ మార్కెట్‌ సూచీలు

ఇప్పుడేం చేయాలంటే..

వివిధ కంపెనీలకు చెందిన ఏఐ మోడళ్లకు శిక్షణ ఇచ్చే తీరు మారాలని నిపుణులు చెబుతున్నారు. అందుకు సంస్థలు పటిష్టమైన రక్షణ చర్యలు చేపట్టాలని పరిశోధకులు కోరుతున్నారు. అధిక స్థాయి నిర్ణయాలకు మానవ ప్రమేయం ఉండాలని సూచిస్తున్నారు. సున్నితమైన డేటాకు ఏఐ అవకాశాన్ని పరిమితం చేయాలని, ఏఐ లక్ష్యాలను జాగ్రత్తగా రూపొందించడం, ప్రమాదకరమైన తార్కిక నమూనాలను గుర్తించడానికి రియల్ టైమ్ మానిటర్లను ఇన్‌స్టాల్‌ చేయాలని చెబుతున్నారు.

Advertisement

Related News By Category

Related News By Tags

Advertisement
 
Advertisement

పోల్

Advertisement