ఏఐకి.. బావోద్వేగ స్పర్శ...! | India's First Pure Speech to Speech AI Model by Pixa AI | Sakshi
Sakshi News home page

ఏఐకి.. బావోద్వేగ స్పర్శ...!

Nov 14 2025 11:05 AM | Updated on Nov 14 2025 11:22 AM

India's First Pure Speech to Speech AI Model by Pixa AI

‘ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌లో ఇండియా ఎక్కడ ఉంది?’ అనే ప్రశ్నకు జవాబు చెప్పాలనుకున్నాడు రాజస్థాన్‌లోని జైపుర్‌కు చెందిన ఐఐటీ–బిహెచ్‌యూ గ్రాడ్యుయేట్‌ స్పర్శ్‌ అగర్వాల్‌. ‘పిక్సా ఏఐ’ స్టార్టప్‌తో తొలి అడుగు వేశాడు. ‘లూనా’తో మరో అడుగు వేసి ఏఐ సాంకేతికతలో మన దేశం ఎక్కడ ఉందో చెప్పకనే చెప్పాడు. ‘ఏఐతో జనరేట్‌ చేసిన మాటలు ఎంతైనా యాంత్రికంగానే ఉంటాయి’ అనే విమర్శ విన్న అగర్వాల్‌ యాంత్రిక వాసనలు లేని, రకరకాల భావోద్వేగాలతో అచ్చం మనిషిలా సహజంగా మాట్లాడే, పాడే ‘లూనా’ను ఆవిష్కరించాడు...

పాడడం, గుసగుసలాడడం, విరామం తీసుకొని మాట్లాడడం నుంచి సందర్భానికి తగినట్లు భావోద్వేగంతో స్పందించడం వరకు ‘లూనా’ పేరుతో స్పీచ్‌–టు–స్పీచ్‌ ఫౌండేషనల్‌ మోడల్‌కు రూపకల్పన చేశాడు స్పర్శ్‌ అగర్వాల్‌. లూనా ఏఐ మోడల్‌ ఆడియోను టెక్ట్స్‌గా మారుస్తుంది. భాష కృత్రిమంగా ఉండకుండా సహజంగా ఉంటుంది. ‘అచ్చం మనిషిలాగే మాట్లాడుతుంది’ అనిపిస్తుంది.

‘ఏఐకి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. దీనికి లూనాతో మేము సమాధానం చె΄్పాం. లూనా అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం’ అని ‘ఎక్స్‌’లో పోస్ట్‌ పెట్టాడు అగర్వాల్‌. ‘నాకు రిసెర్చ్‌ల్యాబ్‌ లేదు. పెద్దగా ఆర్థిక వనరులు లేవు’ అంటాడు అగర్వాల్‌. పరిమిత వనరులతోనే ‘లూనా’కు రూపకల్పన చేయడం విశేషం.

ఆటోమేకర్స్, గేమింగ్‌ ΄్లాట్‌ఫామ్స్, కన్జ్యూమర్‌ ఏఐ కంపెనీల నుంచి ‘లూనా’కు డిమాండ్‌ మొదలైంది. ‘చాలా వాయిస్‌ మోడల్స్‌ కస్టమర్‌ స΄ోర్ట్‌ కోసం నిర్మించబడ్డాయి. లూనా మాత్రం ఎమోషన్‌ ఆధారంగా నిర్మించబడింది’ అంటాడు అగర్వాల్‌. పిల్లల కోసం వాయిస్‌ ఏఐ బొమ్మలను తయారుచేసే క్రమంలో ఎమోషన్‌కు సంబంధించిన సాంకేతికత ‘ఏఐ’లో మిస్‌ అవుతుందనే విషయం గ్రహించిన అగర్వాల్‌ ‘భావోద్వేగ ‘ఏఐ’పై దృష్టి పెట్టాడు.

‘జ్ఞాని’లాంటి భారతీయ వాయిస్‌ మోడళ్ళు కస్టమర్‌–సర్వీస్‌ ఇంటరాక్షన్, టెక్ట్స్‌–టు–స్పీచ్‌ సిస్టమ్‌లను ఆటోమేట్‌ చేయడంపై దృష్టి సారిస్తుండగా లూనా వేరే మార్గాన్ని ఎంచుకుంది. దానిని భావోద్వేగంతో కూడిన, స్వచ్ఛమైన స్పీచ్‌–టు–స్పీచ్‌ సిస్టమ్‌గా అభివృద్ధి చేసింది. ‘వాయిస్‌ ఏఐ అనేది కాల్‌ సపోర్ట్‌ సెంటర్‌లను ఆటోమేట్‌ చేయడం మాత్రమే కాదు, కృత్రిమ భావోద్వేగ మేధస్సును నిర్మించడం అని మేము నమ్ముతున్నాం’ అంటున్నాడు అగర్వాల్‌. ప్రస్తుతం లూనా ఇంగ్లీష్‌కు మాత్రమే సర్ట్‌ చేస్తుంది. 

‘రాబోయే రోజుల్లో లూనాకు బహుభాషా సామర్థ్యాలు జోడించబడతాయి’ అంటున్నాడు అగర్వాల్‌. ‘అతడి ఆవిష్కరణ అద్భుతం’ అంటున్నారు హెచ్‌సీఎల్‌ కో–ఫౌండర్, అజయ్‌ చౌదరి, స్మాలెస్ట్‌.ఏఐ ఫౌండర్‌ సుదర్శన్‌ కామత్‌.డబ్ల్యూడీఎఫ్‌ ఫండ్‌కు పదిహేనువేలకు పైగా దరఖాస్తులు వచ్చాయి. అందులో నుంచి ఎంపికైన ఏకైక సోలో ఫౌండర్‌ స్పర్శ్‌ అగర్వాల్‌. అతడు మరిన్ని విజయాలు సాధించాలని ఆశిద్దాం.

వరల్డ్‌ క్లాస్‌ టెక్నాలజీతో...
ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌(ఏఐ)కి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. ‘లూనా’తో మేము సమాధానం చె΄్పాం. ‘లూనా’ అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం. వరల్డ్‌ క్లాస్‌ టెక్నాలజీ మన దేశం నుంచి కూడా వస్తుంది అని చెప్పడానికి లూనా బలమైన ఉదాహరణ. ఎమోషనల్లీ ఇంటెలిజెంట్‌ ఏఐ ఇన్నోవేషన్‌ హబ్‌గా ఇండియా రూపుదిద్దుకోవడానికి ‘లూనా’తో మా వంతు ప్రయత్నం చేశాం.
– స్పర్శ్‌ అగర్వాల్, పిక్సా ఏఐ,  ఫౌండర్‌ 

 

(చదవండి: Bhavya Narasimhamurthy on: అటు రాజకీయ నాయకురాలు.. ఇటు ఆర్మీ అధికారిగా..!)

Advertisement

Related News By Category

Related News By Tags

Advertisement
 
Advertisement
Advertisement