ఏఐకి.. భావోద్వేగ స్పర్శ...!

Nov 14 2025 11:05 AM | Updated on Nov 14 2025 4:14 PM

India's First Pure Speech to Speech AI Model by Pixa AI

‘ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌లో ఇండియా ఎక్కడ ఉంది?’ అనే ప్రశ్నకు జవాబు చెప్పాలనుకున్నాడు రాజస్థాన్‌లోని జైపుర్‌కు చెందిన ఐఐటీ–బిహెచ్‌యూ గ్రాడ్యుయేట్‌ స్పర్శ్‌ అగర్వాల్‌. ‘పిక్సా ఏఐ’ స్టార్టప్‌తో తొలి అడుగు వేశాడు. ‘లూనా’తో మరో అడుగు వేసి ఏఐ సాంకేతికతలో మన దేశం ఎక్కడ ఉందో చెప్పకనే చెప్పాడు. ‘ఏఐతో జనరేట్‌ చేసిన మాటలు ఎంతైనా యాంత్రికంగానే ఉంటాయి’ అనే విమర్శ విన్న అగర్వాల్‌ యాంత్రిక వాసనలు లేని, రకరకాల భావోద్వేగాలతో అచ్చం మనిషిలా సహజంగా మాట్లాడే, పాడే ‘లూనా’ను ఆవిష్కరించాడు...

పాడడం, గుసగుసలాడడం, విరామం తీసుకొని మాట్లాడడం నుంచి సందర్భానికి తగినట్లు భావోద్వేగంతో స్పందించడం వరకు ‘లూనా’ పేరుతో స్పీచ్‌–టు–స్పీచ్‌ ఫౌండేషనల్‌ మోడల్‌కు రూపకల్పన చేశాడు స్పర్శ్‌ అగర్వాల్‌. లూనా ఏఐ మోడల్‌ ఆడియోను టెక్ట్స్‌గా మారుస్తుంది. భాష కృత్రిమంగా ఉండకుండా సహజంగా ఉంటుంది. ‘అచ్చం మనిషిలాగే మాట్లాడుతుంది’ అనిపిస్తుంది.

‘ఏఐకి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. దీనికి లూనాతో మేము సమాధానం చె΄్పాం. లూనా అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం’ అని ‘ఎక్స్‌’లో పోస్ట్‌ పెట్టాడు అగర్వాల్‌. ‘నాకు రిసెర్చ్‌ల్యాబ్‌ లేదు. పెద్దగా ఆర్థిక వనరులు లేవు’ అంటాడు అగర్వాల్‌. పరిమిత వనరులతోనే ‘లూనా’కు రూపకల్పన చేయడం విశేషం.

ఆటోమేకర్స్, గేమింగ్‌ ΄్లాట్‌ఫామ్స్, కన్జ్యూమర్‌ ఏఐ కంపెనీల నుంచి ‘లూనా’కు డిమాండ్‌ మొదలైంది. ‘చాలా వాయిస్‌ మోడల్స్‌ కస్టమర్‌ స΄ోర్ట్‌ కోసం నిర్మించబడ్డాయి. లూనా మాత్రం ఎమోషన్‌ ఆధారంగా నిర్మించబడింది’ అంటాడు అగర్వాల్‌. పిల్లల కోసం వాయిస్‌ ఏఐ బొమ్మలను తయారుచేసే క్రమంలో ఎమోషన్‌కు సంబంధించిన సాంకేతికత ‘ఏఐ’లో మిస్‌ అవుతుందనే విషయం గ్రహించిన అగర్వాల్‌ ‘భావోద్వేగ ‘ఏఐ’పై దృష్టి పెట్టాడు.

‘జ్ఞాని’లాంటి భారతీయ వాయిస్‌ మోడళ్ళు కస్టమర్‌–సర్వీస్‌ ఇంటరాక్షన్, టెక్ట్స్‌–టు–స్పీచ్‌ సిస్టమ్‌లను ఆటోమేట్‌ చేయడంపై దృష్టి సారిస్తుండగా లూనా వేరే మార్గాన్ని ఎంచుకుంది. దానిని భావోద్వేగంతో కూడిన, స్వచ్ఛమైన స్పీచ్‌–టు–స్పీచ్‌ సిస్టమ్‌గా అభివృద్ధి చేసింది. ‘వాయిస్‌ ఏఐ అనేది కాల్‌ సపోర్ట్‌ సెంటర్‌లను ఆటోమేట్‌ చేయడం మాత్రమే కాదు, కృత్రిమ భావోద్వేగ మేధస్సును నిర్మించడం అని మేము నమ్ముతున్నాం’ అంటున్నాడు అగర్వాల్‌. ప్రస్తుతం లూనా ఇంగ్లీష్‌కు మాత్రమే సర్ట్‌ చేస్తుంది. 

‘రాబోయే రోజుల్లో లూనాకు బహుభాషా సామర్థ్యాలు జోడించబడతాయి’ అంటున్నాడు అగర్వాల్‌. ‘అతడి ఆవిష్కరణ అద్భుతం’ అంటున్నారు హెచ్‌సీఎల్‌ కో–ఫౌండర్, అజయ్‌ చౌదరి, స్మాలెస్ట్‌.ఏఐ ఫౌండర్‌ సుదర్శన్‌ కామత్‌.డబ్ల్యూడీఎఫ్‌ ఫండ్‌కు పదిహేనువేలకు పైగా దరఖాస్తులు వచ్చాయి. అందులో నుంచి ఎంపికైన ఏకైక సోలో ఫౌండర్‌ స్పర్శ్‌ అగర్వాల్‌. అతడు మరిన్ని విజయాలు సాధించాలని ఆశిద్దాం.

వరల్డ్‌ క్లాస్‌ టెక్నాలజీతో...
ఆర్టిఫిషియల్‌ ఇంటెలిజెన్స్‌(ఏఐ)కి సంబంధించి ఇండియా ఎక్కడ ఉంది? అనే ప్రశ్న ప్రతి వాట్సాప్‌ గ్రూప్‌లో కనిపిస్తోంది. కాన్ఫరెన్స్‌ హాల్‌లో వినిపిస్తోంది. ‘లూనా’తో మేము సమాధానం చె΄్పాం. ‘లూనా’ అనేది ప్రపంచంలోనే మొట్టమొదటి స్పీచ్‌–టు–స్పీచ్‌ ఏఐ మోడల్‌ అని గర్వంగా చెబుతున్నాం. వరల్డ్‌ క్లాస్‌ టెక్నాలజీ మన దేశం నుంచి కూడా వస్తుంది అని చెప్పడానికి లూనా బలమైన ఉదాహరణ. ఎమోషనల్లీ ఇంటెలిజెంట్‌ ఏఐ ఇన్నోవేషన్‌ హబ్‌గా ఇండియా రూపుదిద్దుకోవడానికి ‘లూనా’తో మా వంతు ప్రయత్నం చేశాం.
– స్పర్శ్‌ అగర్వాల్, పిక్సా ఏఐ,  ఫౌండర్‌ 

 

