ఏఐకి.. భావోద్వేగ స్పర్శ...! | India's First Pure Speech to Speech AI Model by Pixa AI | Sakshi
Sakshi News home page

ఏఐకి.. భావోద్వేగ స్పర్శ...!

Nov 14 2025 11:05 AM | Updated on Nov 14 2025 4:14 PM

India's First Pure Speech to Speech AI Model by Pixa AI

‘ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌లో ఇండియా ఎక్కడ ఉంది?’ అనే ప్రశ్నకు జవాబు చెప్పాలనుకున్నాడు రాజస్థాన్‌లోని జైపుర్‌కు చెందిన ఐఐటీ–బిహెచ్‌యూ గ్రాడ్యుయేట్‌ స్పర్శ్‌ అగర్వాల్‌. ‘పిక్సా ఏఐ’ స్టార్టప్‌తో తొలి అడుగు వేశాడు. ‘లూనా’తో మరో అడుగు వేసి ఏఐ సాంకేతికతలో మన దేశం ఎక్కడ ఉందో చెప్పకనే చెప్పాడు. ‘ఏఐతో జనరేట్‌ చేసిన మాటలు ఎంతైనా యాంత్రికంగానే ఉంటాయి’ అనే విమర్శ విన్న అగర్వాల్‌ యాంత్రిక వాసనలు లేని, రకరకాల భావోద్వేగాలతో అచ్చం మనిషిలా సహజంగా మాట్లాడే, పాడే ‘లూనా’ను ఆవిష్కరించాడు...

పాడడం, గుసగుసలాడడం, విరామం తీసుకొని మాట్లాడడం నుంచి సందర్భానికి తగినట్లు భావోద్వేగంతో స్పందించడం వరకు ‘లూనా’ పేరుతో స్పీచ్‌–టు–స్పీచ్‌ ఫౌండేషనల్‌ మోడల్‌కు రూపకల్పన చేశాడు స్పర్శ్‌ అగర్వాల్‌. లూనా ఏఐ మోడల్‌ ఆడియోను టెక్ట్స్‌గా మారుస్తుంది. భాష కృత్రిమంగా ఉండకుండా సహజంగా ఉంటుంది. ‘అచ్చం మనిషిలాగే మాట్లాడుతుంది’ అనిపిస్తుంది.

‘ఏఐకి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. దీనికి లూనాతో మేము సమాధానం చె΄్పాం. లూనా అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం’ అని ‘ఎక్స్‌’లో పోస్ట్‌ పెట్టాడు అగర్వాల్‌. ‘నాకు రిసెర్చ్‌ల్యాబ్‌ లేదు. పెద్దగా ఆర్థిక వనరులు లేవు’ అంటాడు అగర్వాల్‌. పరిమిత వనరులతోనే ‘లూనా’కు రూపకల్పన చేయడం విశేషం.

ఆటోమేకర్స్, గేమింగ్‌ ΄్లాట్‌ఫామ్స్, కన్జ్యూమర్‌ ఏఐ కంపెనీల నుంచి ‘లూనా’కు డిమాండ్‌ మొదలైంది. ‘చాలా వాయిస్‌ మోడల్స్‌ కస్టమర్‌ స΄ోర్ట్‌ కోసం నిర్మించబడ్డాయి. లూనా మాత్రం ఎమోషన్‌ ఆధారంగా నిర్మించబడింది’ అంటాడు అగర్వాల్‌. పిల్లల కోసం వాయిస్‌ ఏఐ బొమ్మలను తయారుచేసే క్రమంలో ఎమోషన్‌కు సంబంధించిన సాంకేతికత ‘ఏఐ’లో మిస్‌ అవుతుందనే విషయం గ్రహించిన అగర్వాల్‌ ‘భావోద్వేగ ‘ఏఐ’పై దృష్టి పెట్టాడు.

‘జ్ఞాని’లాంటి భారతీయ వాయిస్‌ మోడళ్ళు కస్టమర్‌–సర్వీస్‌ ఇంటరాక్షన్, టెక్ట్స్‌–టు–స్పీచ్‌ సిస్టమ్‌లను ఆటోమేట్‌ చేయడంపై దృష్టి సారిస్తుండగా లూనా వేరే మార్గాన్ని ఎంచుకుంది. దానిని భావోద్వేగంతో కూడిన, స్వచ్ఛమైన స్పీచ్‌–టు–స్పీచ్‌ సిస్టమ్‌గా అభివృద్ధి చేసింది. ‘వాయిస్‌ ఏఐ అనేది కాల్‌ సపోర్ట్‌ సెంటర్‌లను ఆటోమేట్‌ చేయడం మాత్రమే కాదు, కృత్రిమ భావోద్వేగ మేధస్సును నిర్మించడం అని మేము నమ్ముతున్నాం’ అంటున్నాడు అగర్వాల్‌. ప్రస్తుతం లూనా ఇంగ్లీష్‌కు మాత్రమే సర్ట్‌ చేస్తుంది. 

‘రాబోయే రోజుల్లో లూనాకు బహుభాషా సామర్థ్యాలు జోడించబడతాయి’ అంటున్నాడు అగర్వాల్‌. ‘అతడి ఆవిష్కరణ అద్భుతం’ అంటున్నారు హెచ్‌సీఎల్‌ కో–ఫౌండర్, అజయ్‌ చౌదరి, స్మాలెస్ట్‌.ఏఐ ఫౌండర్‌ సుదర్శన్‌ కామత్‌.డబ్ల్యూడీఎఫ్‌ ఫండ్‌కు పదిహేనువేలకు పైగా దరఖాస్తులు వచ్చాయి. అందులో నుంచి ఎంపికైన ఏకైక సోలో ఫౌండర్‌ స్పర్శ్‌ అగర్వాల్‌. అతడు మరిన్ని విజయాలు సాధించాలని ఆశిద్దాం.

వరల్డ్‌ క్లాస్‌ టెక్నాలజీతో...
ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌(ఏఐ)కి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. ‘లూనా’తో మేము సమాధానం చె΄్పాం. ‘లూనా’ అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం. వరల్డ్‌ క్లాస్‌ టెక్నాలజీ మన దేశం నుంచి కూడా వస్తుంది అని చెప్పడానికి లూనా బలమైన ఉదాహరణ. ఎమోషనల్లీ ఇంటెలిజెంట్‌ ఏఐ ఇన్నోవేషన్‌ హబ్‌గా ఇండియా రూపుదిద్దుకోవడానికి ‘లూనా’తో మా వంతు ప్రయత్నం చేశాం.
– స్పర్శ్‌ అగర్వాల్, పిక్సా ఏఐ,  ఫౌండర్‌ 

 

(చదవండి: Bhavya Narasimhamurthy on: అటు రాజకీయ నాయకురాలు.. ఇటు ఆర్మీ అధికారిగా..!)

Advertisement
 
Advertisement
Advertisement