నాలుగు ఏఐ మోడల్స్ ఫెయిల్.. 10/10 స్కోర్‌ చేసిన మానవ మేథ! | Top AI Models Fail In Advanced Math Test As Human Intelligence Outperforms Machines, Check More Details Inside | Sakshi
Sakshi News home page

నాలుగు ఏఐ మోడల్స్ ఫెయిల్.. 10/10 స్కోర్‌ చేసిన మానవ మేథ!

Jun 17 2026 9:04 AM | Updated on Jun 17 2026 11:51 AM

Humans Beat AI 10 0 in Ultimate Math Showdown

లండన్‌: కృత్రిమ మేధస్సు (ఏఐ) ప్రపంచాన్ని శాసిస్తోందని, మానవ మేధస్సును మించిపోతోందని భావిస్తున్న తరుణంలో ఒక సంచలన నిజం అందరికీ షాకిస్తోంది.  ఒక కఠినమైన గణిత పరీక్షలో ప్రపంచంలోని టాప్-4 ఏఐ మోడల్స్ ఘోరంగా విఫలమయ్యాయి. ఇంటర్నెట్‌లో ఎక్కడా అందుబాటులో లేని సరికొత్త పరిశోధనా స్థాయి గణిత సమస్యలను ఏఐ మోడల్స్‌కు పరీక్షగా పెట్టగా, అవి కనీస మార్కులు కూడా సాధించలేకపోయాయి. అదే సమయంలో మానవ మేధావులు ఆ పదికి పది సమస్యలను అలవోకగా పరిష్కరించి, తామే ఎప్పుడూ ‘సుప్రీం’ అని నిరూపించారు. ప్రముఖ ‘నేచర్’ జర్నల్‌లో ఈ ఆసక్తికరమైన పరిశోధన వివరాలు ప్రచురితమయ్యాయి.

అసలు రంగు బయటపడింది
సాధారణంగా ఏఐ మోడల్స్ తమ డేటాబేస్‌లో ఉన్న సమాచారాన్ని స్కాన్ చేసి క్షణాల్లో సమాధానాలు ఇస్తుంటాయి. కానీ, ఈసారి వాటిని నిలువరించడానికి ‘ఫస్ట్ ప్రూఫ్’ అనే సరికొత్త బెంచ్‌మార్క్ విధానాన్ని నిపుణులు ఉపయోగించారు. వివిధ గణిత విభాగాలకు చెందిన 10 మంది అగ్రశ్రేణి పరిశోధకులు తమ కెరీర్‌లో ఎప్పుడో ఒకప్పుడు పరిష్కరించి, ఇప్పటివరకు ఎక్కడా ప్రచురించని 10 సరికొత్త మ్యాథ్స్ సమస్యలను ఈ పరీక్ష కోసం సేకరించారు. ఇంటర్నెట్‌లో వీటికి ఎలాంటి ఆధారాలు, సూచనలు లేకపోవడంతో ఏఐ మోడల్స్ కాపీ కొట్టే అవకాశం లేకుండా పోయింది. ఈ స్వతంత్ర పరీక్షను 30 మంది గణిత శాస్త్రవేత్తలతో కూడిన ప్రత్యేక జ్యూరీ పర్యవేక్షించింది.

బరిలో నిలిచిన దిగ్గజాలు.. 
ఈ పోటీలో పబ్లిక్‌గా అందుబాటులో ఉన్న నాలుగు ప్రముఖ ఏఐ మోడల్స్ తలపడ్డాయి. ఓపెన్ ఏఐ తన సరికొత్త ‘చాట్‌జీపీటీ 5.5 ప్రో’ మోడల్‌ను నేరుగా బరిలోకి దింపగా.. ప్రిన్స్‌టన్ యూనివర్సిటీ (జెమిని 3.1 ప్రో ఆధారిత హార్నెస్), యూసీఎల్‌ఏ, స్విస్ ఫెడరల్ ఇన్‌స్టిట్యూట్ ఆఫ్ టెక్నాలజీ పరిశోధక బృందాలు చాట్‌జీపీటీ, క్లాడ్, జెమిని చాట్‌బాట్‌లను ఉపయోగించి రూపొందించిన ఆటోమేటెడ్ వ్యవస్థల ద్వారా పోటీ పడ్డాయి. అయితే అత్యుత్తమ ప్రదర్శన కనబరిచిన 'ETH Zurich' సిస్టమ్ కేవలం 6 సమస్యలను మాత్రమే పరిష్కరించగలిగింది. యూసీఎల్‌ఏ రెండో స్థానంలో నిలవగా, ఓపెన్ ఏఐ సొంత మోడల్ మూడో స్థానానికి పరిమితమైంది.

మానవ మేధస్సుకే అగ్రతాంబూలం
గతంలో ఏఐ వ్యవస్థలు 80 ఏళ్ల నాటి సంక్లిష్టమైన గణిత సమస్యలను పరిష్కరించి ఉండవచ్చు. కానీ సరికొత్త ఆలోచనలు, సృజనాత్మకత అవసరమైన పరిశోధనా స్థాయి సమస్యల విషయానికి వస్తే మానవ మేధస్సును అవి అందుకోలేవని ఈ పరీక్ష స్పష్టం చేసింది. గణిత శాస్త్రవేత్తలకు స్వతంత్ర సహాయకులుగా, ప్రూఫ్-చెకర్స్‌గా ఏఐ మోడల్స్ పూర్తిగా బాధ్యతలు చేపట్టడానికి ఇంకా చాలా కాలం పడుతుందని పరిశోధకులు తేల్చిచెప్పారు. భవిష్యత్తులో ఏఐ సామర్థ్యాలను మరింత ఖచ్చితంగా అంచనా వేయడానికి మరిన్ని కఠినమైన పరీక్షలను నిర్వహించనున్నట్లు ‘ఫస్ట్ ప్రూఫ్’ బృందం వెల్లడించింది.

ఇది కూడా చదవండి: అశ్లీల, కుల వివక్ష పాటలు పెడితే ఇక జైలుకే!
 

Advertisement
Advertisement
 
Advertisement
Advertisement