Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ | Sakshi
Sakshi News home page

Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ

Published Sun, Dec 17 2023 2:36 AM

AI Battle: Google launches Gemini, its foundation model - Sakshi

భవిష్యత్తంతా కృత్రిమ మేధదే. ఇది అందరూ ముక్తకంఠంతో చెబుతున్న మాట. ఈ నేపథ్యంలో ఆ రంగంపై పట్టు బిగించేందుకు ఐటీ దిగ్గజాలన్నీ శాయశక్తులా ప్రయత్నిస్తున్నాయి. మైక్రోసాఫ్ట్‌ ఇప్పటికే ఓపెన్‌ఏఐ యాజమాన్యంలోని చాట్‌జీపీటీ ప్రాజెక్టులో మెజారిటీ భాగస్వామి కావడం ద్వారా ఈ దిశగా తొలి అడుగు వేసింది.

గడచిన ఏడాది కాలంలో మరెన్నో ఏఐ మోడళ్లు తెరపైకి వచ్చినా ఓపెన్‌ ఏఐ తాలూకు జీపీటీ మోడళ్లతో పోటీ పడలేకపోతున్నాయి. దానికి పోటీగా జెమినీ పేరుతో గూగుల్‌ తాజాగా కొత్త ఏఐ మోడల్‌ను ప్రకటించింది. దీనిపై ఇప్పుడు అంతటా ఆసక్తి నెలకొంది...

మొగ్గు జెమినీకే కనిపిస్తున్నా...
అవడానికి చాట్‌జీపీటీ, జెమినీ రెండూ జెనరేటివ్‌ ఏఐ మోడళ్లే. ఇవి ఇన్‌పుట్‌ ట్రైనింగ్‌ డేటా తాలూకు ప్యాట్రన్ల ఆధారంగా పిక్చర్లు, పదాలు, ఇతర మీడియా వంటి కొత్త డేటాను కోరిన విధంగా జెనరేట్‌ చేస్తాయి. చాట్‌జీపీటీ ప్రధానంగా లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌ (ఎల్‌ఎల్‌ఎం). ఇది టెక్స్‌ట్‌ జెనరేట్‌ చేయడంపై ఎక్కువగా దృష్టి పెడుతుంది. అలాగే జీపీటీ ఆధారిత వెబ్‌ సంభాషణల యాప్‌గా కూడా పని చేస్తుంది. గూగుల్‌కు కూడా బార్డ్‌ పేరుతో ఇలాంటి యాప్‌ ఇప్పటికే ఉంది.

ఇది గతంలో లాఎండీఏ లాంగ్వేజ్‌ మోడ్‌పై ఆధారపడేది. ఇప్పుడు జెమినీ కోసమని పీఏఎల్‌ఎం2 మోడ్‌గా దాన్ని అప్‌గ్రేడ్‌ చేస్తోంది గూగుల్‌. ఇది మల్టీ మోడల్‌ తరహా మోడల్‌ కావడమే చాట్‌జీపీటీతో పాటు ఇతర అన్ని ఏఐల కంటే జెమినీని ఇప్పుడు ప్రత్యేకంగా నిలుపుతోంది. ఎందుకంటే ఇది మలి్టపుల్‌ ఇన్‌పుట్, ఔట్‌పుట్‌ మోడ్లతో నేరుగా పని చేయగలదు. అంతేగాక టెక్స్‌ట్, ఆడియో, వీడియోలను కూడా బాగా సపోర్ట్‌ చేస్తుంది.

ఓపెన్‌ ఏఐ కూడా ఇలాంటి సామర్థ్యంతో కూడిన జీపీటీ–4 విజన్‌ మోడల్‌ను ప్రకటించినా అది జెమినీ మాదిరిగా పూర్తిస్థాయి మలీ్టమోడల్‌ కాదు. ఎందుకంటే ఇది ప్రధానంగా టెక్స్ట్‌ పైనే ఆధారపడుతుంది. ఉదాహరణకు ఆడియో ఇన్‌పుట్స్‌ను స్పీచ్‌ ఔట్‌పుట్‌గా మార్చేందుకు విష్పర్‌ అనే స్పీచ్‌ టు టెక్స్ట్‌ ఇన్‌పుట్‌ లెరి్నంగ్‌ మోడల్‌ సాయం తీసుకుంటుంది. ఇమేజీలను అందించాలన్నా అంతే.

అది జెనరేట్‌ చేసే టెక్స్ట్‌ ప్రాంప్‌్టలను డాల్‌–ఈ2 అనే మరో డీప్‌ లెరి్నంగ్‌ మోడల్‌ ఇమేజీలుగా మారుస్తుంది. కానీ గూగుల్‌ మాత్రం జెమినీని ఇలా కాకుండా పూర్తిస్థాయి మల్టీ మోడల్‌ ఏఐగా తీర్చిదిద్దుతోంది. ఇతర లెరి్నంగ్‌ మోడళ్ల సాయంతో నిమిత్తం లేకుండా నేరుగా ఆడియో, ఇమేజీలు, వీడియో, టెక్స్ట్‌ వంటి ఇన్‌పుట్‌ టైప్‌లను అది తనంత తానే కావాల్సిన ఔట్‌పుట్లుగా మార్చేస్తుంది.

జీపీటీ–4తో పోలిస్తే జెమినీ పనితీరు ఎలా ఉంటుందో ఇప్పటికి తెలియకపోయినా దాన్ని చాలా హెచ్చు సామర్థ్యంతో రూపొందిస్తున్నట్టు గూగుల్‌ ప్రకటించుకుంది. దానికిప్పటికే జెమినీ 1.0 అల్ట్రా అని కూడా పేరు పెట్టింది. ప్రయోగాత్మకంగా చేసిన పరీక్షల్లో ఇది జీపీటీ–4 కంటే మిన్నగా తేలిందని చెబుతోంది కూడా. ఇందుకు రుజువుగా ఓ వీడియో కూడా విడుదల చేసింది. కాకపోతే అందులో చూపించిన టాస్‌్కలను రియల్‌టైమ్‌లో చేయడంలో జెమినీ ఏ మేరకు కృతకృత్యమవుతుందో చూడాల్సి ఉంది.

అంతిమ లబ్ధి యూజర్లకే...
ఈ సందేహాల మాట ఎలా ఉన్నా జెమినీ వంటి భారీ మలీ్టమోడల్‌ మోడళ్లు జెనరేటివ్‌ ఏఐ రంగంలో విప్లవాత్మక మార్పులకు శ్రీకారం చుడతాయని ఐటీ రంగ నిపుణులు అంచనా వేస్తున్నారు. ఎందుకంటే ప్రధానంగా టెక్స్ట్‌ ఆధారితమైన జీపీటీ–4 ఇప్పటికే ఏకంగా 500 బిలియన్‌ పదాలపై శిక్షణ పొందింది! అంటే, పబ్లిక్‌ డొమైన్లో అందుబాటులో ఉన్న నాణ్యమైన పదాలన్నీ దానికిప్పటికే చిరపరిచితమని చెప్పవచ్చు.

ఇలాంటి ట్రైనింగ్‌ డేటాతో పాటు మోడల్‌ తాలూకు సంక్లిష్టత ఎంత ఎక్కువగా ఉంటే దాని పనితీరు అంత ప్రభావవంతంగా ఉంటుంది. అయితే ఇలాంటి అన్ని రకాల డేటాను నేరుగా వాడగల జెమినీ వంటి ఏఐ మోడళ్లు మున్ముందు మరింత సామర్థ్యం సంతరించుకోవడం ఖాయంగా కని్పస్తోంది. అదే సమయంలో దీనికి పోటీగా ఓపెన్‌ ఏఐ కూడా అప్‌గ్రేడెడ్‌ జీపీటీ–5 వెర్షన్‌పై ఇప్పటికే ముమ్మరంగా కృషి చేస్తోంది. ఈ నిరంతర పోటీ అంతిమంగా యూజర్లకే మరింత లబ్ధి చేకూరుస్తుందని ఐటీ రంగ నిపుణులు చెబుతున్నారు.

– సాక్షి, నేషనల్‌ డెస్క్‌ 

Advertisement
 
Advertisement
 
Advertisement