Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ | AI Battle: Google launches Gemini, its foundation model | Sakshi
Sakshi News home page

Generative AI Battle: చాట్‌జీపీటీకి పోటీగా జెమినీ

Dec 17 2023 2:36 AM | Updated on Dec 17 2023 2:36 AM

AI Battle: Google launches Gemini, its foundation model - Sakshi

భవిష్యత్తంతా కృత్రిమ మేధదే. ఇది అందరూ ముక్తకంఠంతో చెబుతున్న మాట. ఈ నేపథ్యంలో ఆ రంగంపై పట్టు బిగించేందుకు ఐటీ దిగ్గజాలన్నీ శాయశక్తులా ప్రయత్నిస్తున్నాయి. మైక్రోసాఫ్ట్‌ ఇప్పటికే ఓపెన్‌ఏఐ యాజమాన్యంలోని చాట్‌జీపీటీ ప్రాజెక్టులో మెజారిటీ భాగస్వామి కావడం ద్వారా ఈ దిశగా తొలి అడుగు వేసింది.

గడచిన ఏడాది కాలంలో మరెన్నో ఏఐ మోడళ్లు తెరపైకి వచ్చినా ఓపెన్‌ ఏఐ తాలూకు జీపీటీ మోడళ్లతో పోటీ పడలేకపోతున్నాయి. దానికి పోటీగా జెమినీ పేరుతో గూగుల్‌ తాజాగా కొత్త ఏఐ మోడల్‌ను ప్రకటించింది. దీనిపై ఇప్పుడు అంతటా ఆసక్తి నెలకొంది...

మొగ్గు జెమినీకే కనిపిస్తున్నా...
అవడానికి చాట్‌జీపీటీ, జెమినీ రెండూ జెనరేటివ్‌ ఏఐ మోడళ్లే. ఇవి ఇన్‌పుట్‌ ట్రైనింగ్‌ డేటా తాలూకు ప్యాట్రన్ల ఆధారంగా పిక్చర్లు, పదాలు, ఇతర మీడియా వంటి కొత్త డేటాను కోరిన విధంగా జెనరేట్‌ చేస్తాయి. చాట్‌జీపీటీ ప్రధానంగా లార్జ్‌ లాంగ్వేజ్‌ మోడల్‌ (ఎల్‌ఎల్‌ఎం). ఇది టెక్స్‌ట్‌ జెనరేట్‌ చేయడంపై ఎక్కువగా దృష్టి పెడుతుంది. అలాగే జీపీటీ ఆధారిత వెబ్‌ సంభాషణల యాప్‌గా కూడా పని చేస్తుంది. గూగుల్‌కు కూడా బార్డ్‌ పేరుతో ఇలాంటి యాప్‌ ఇప్పటికే ఉంది.

ఇది గతంలో లాఎండీఏ లాంగ్వేజ్‌ మోడ్‌పై ఆధారపడేది. ఇప్పుడు జెమినీ కోసమని పీఏఎల్‌ఎం2 మోడ్‌గా దాన్ని అప్‌గ్రేడ్‌ చేస్తోంది గూగుల్‌. ఇది మల్టీ మోడల్‌ తరహా మోడల్‌ కావడమే చాట్‌జీపీటీతో పాటు ఇతర అన్ని ఏఐల కంటే జెమినీని ఇప్పుడు ప్రత్యేకంగా నిలుపుతోంది. ఎందుకంటే ఇది మలి్టపుల్‌ ఇన్‌పుట్, ఔట్‌పుట్‌ మోడ్లతో నేరుగా పని చేయగలదు. అంతేగాక టెక్స్‌ట్, ఆడియో, వీడియోలను కూడా బాగా సపోర్ట్‌ చేస్తుంది.

ఓపెన్‌ ఏఐ కూడా ఇలాంటి సామర్థ్యంతో కూడిన జీపీటీ–4 విజన్‌ మోడల్‌ను ప్రకటించినా అది జెమినీ మాదిరిగా పూర్తిస్థాయి మలీ్టమోడల్‌ కాదు. ఎందుకంటే ఇది ప్రధానంగా టెక్స్ట్‌ పైనే ఆధారపడుతుంది. ఉదాహరణకు ఆడియో ఇన్‌పుట్స్‌ను స్పీచ్‌ ఔట్‌పుట్‌గా మార్చేందుకు విష్పర్‌ అనే స్పీచ్‌ టు టెక్స్ట్‌ ఇన్‌పుట్‌ లెరి్నంగ్‌ మోడల్‌ సాయం తీసుకుంటుంది. ఇమేజీలను అందించాలన్నా అంతే.

అది జెనరేట్‌ చేసే టెక్స్ట్‌ ప్రాంప్‌్టలను డాల్‌–ఈ2 అనే మరో డీప్‌ లెరి్నంగ్‌ మోడల్‌ ఇమేజీలుగా మారుస్తుంది. కానీ గూగుల్‌ మాత్రం జెమినీని ఇలా కాకుండా పూర్తిస్థాయి మల్టీ మోడల్‌ ఏఐగా తీర్చిదిద్దుతోంది. ఇతర లెరి్నంగ్‌ మోడళ్ల సాయంతో నిమిత్తం లేకుండా నేరుగా ఆడియో, ఇమేజీలు, వీడియో, టెక్స్ట్‌ వంటి ఇన్‌పుట్‌ టైప్‌లను అది తనంత తానే కావాల్సిన ఔట్‌పుట్లుగా మార్చేస్తుంది.

జీపీటీ–4తో పోలిస్తే జెమినీ పనితీరు ఎలా ఉంటుందో ఇప్పటికి తెలియకపోయినా దాన్ని చాలా హెచ్చు సామర్థ్యంతో రూపొందిస్తున్నట్టు గూగుల్‌ ప్రకటించుకుంది. దానికిప్పటికే జెమినీ 1.0 అల్ట్రా అని కూడా పేరు పెట్టింది. ప్రయోగాత్మకంగా చేసిన పరీక్షల్లో ఇది జీపీటీ–4 కంటే మిన్నగా తేలిందని చెబుతోంది కూడా. ఇందుకు రుజువుగా ఓ వీడియో కూడా విడుదల చేసింది. కాకపోతే అందులో చూపించిన టాస్‌్కలను రియల్‌టైమ్‌లో చేయడంలో జెమినీ ఏ మేరకు కృతకృత్యమవుతుందో చూడాల్సి ఉంది.

అంతిమ లబ్ధి యూజర్లకే...
ఈ సందేహాల మాట ఎలా ఉన్నా జెమినీ వంటి భారీ మలీ్టమోడల్‌ మోడళ్లు జెనరేటివ్‌ ఏఐ రంగంలో విప్లవాత్మక మార్పులకు శ్రీకారం చుడతాయని ఐటీ రంగ నిపుణులు అంచనా వేస్తున్నారు. ఎందుకంటే ప్రధానంగా టెక్స్ట్‌ ఆధారితమైన జీపీటీ–4 ఇప్పటికే ఏకంగా 500 బిలియన్‌ పదాలపై శిక్షణ పొందింది! అంటే, పబ్లిక్‌ డొమైన్లో అందుబాటులో ఉన్న నాణ్యమైన పదాలన్నీ దానికిప్పటికే చిరపరిచితమని చెప్పవచ్చు.

ఇలాంటి ట్రైనింగ్‌ డేటాతో పాటు మోడల్‌ తాలూకు సంక్లిష్టత ఎంత ఎక్కువగా ఉంటే దాని పనితీరు అంత ప్రభావవంతంగా ఉంటుంది. అయితే ఇలాంటి అన్ని రకాల డేటాను నేరుగా వాడగల జెమినీ వంటి ఏఐ మోడళ్లు మున్ముందు మరింత సామర్థ్యం సంతరించుకోవడం ఖాయంగా కని్పస్తోంది. అదే సమయంలో దీనికి పోటీగా ఓపెన్‌ ఏఐ కూడా అప్‌గ్రేడెడ్‌ జీపీటీ–5 వెర్షన్‌పై ఇప్పటికే ముమ్మరంగా కృషి చేస్తోంది. ఈ నిరంతర పోటీ అంతిమంగా యూజర్లకే మరింత లబ్ధి చేకూరుస్తుందని ఐటీ రంగ నిపుణులు చెబుతున్నారు.

– సాక్షి, నేషనల్‌ డెస్క్‌ 

Advertisement
 
Advertisement
Advertisement