அடிப்படையில் நான் ஒரு இயற்பியல் மாணவன், பட்டப்படிப்பு முடித்த கையோடு தகவல்தொழிற்நுட்பச் சேவை நிறுவனத்தில் கடைநிலை ஊழியராகச் சேர்ந்தேன். ஆராய்ச்சித் துறையில் ஈடுபாடுயிருந்தாலும் அன்றைய குடும்பச் சூழலால் பணிக்குச் செல்வதைத் தவிர வேறு வாய்ப்பில்லை. பணிக்காரணங்களால் சில நிரல் மொழிகளைக் (Programming Language) கற்று, சிறிய நிரலாக்கத்தைச் செய்துவந்தேன். அங்குதான் இணையம் பரிச்சியமானது. அதுவரை எழுதிவந்த மழலைக் கவிதைகளை இணையத்தில் வெளியிட்டு வந்தேன். அதன்வழி ஒரு வலைப்பதிவனாகவும் மாறிக்கொண்டேன். தொடர்ந்து நகைச்சுவைத் துணுக்குகள் முதல் கதைகள் வரை எழுதிக் கொண்டிருந்தேன். எனது நிரலாக்க அறிவில் தமிழ்ச் சார்ந்த கருவிகள் செய்து இணையத்தில் வெளியிட்டேன்.

அப்போது ஒருநாள் எனது எழுத்துப் பிழைகளைச் சுட்டிக் காட்டி ஒருவர் பின்னூட்டமிட்டிருந்தார். அதுவொருவகையில் திருப்புமுனையாகவும் கூட அமைந்தது எனலாம். மொழியைக் கணினிக்குக் கற்றுக் கொடுத்து அதனடிப்படையில் பிழைகளைத் திருத்த வேண்டுமென்றால் பல ஆண்டுகளாகலாம். எனவே எனது எழுத்துப்பிழையை நீக்கக் குறுக்குவழிகளில் (தொழில்மொழியில் சாமர்த்தியமாக) ஒரு திருத்தி செய்ய முடியுமா என ஆராயத் தொடங்கினேன். பல்வேறு யுக்திகளைப் பயன்படுத்தி ஒரு சொல்லுக்கும் மற்றொரு சொல்லுக்கும் இடையில் ஒற்று வருமா என்று கணிக்கத் தொடங்கினேன். தமிழுக்கே உரிய இலக்கணங்கள் சவாலாக இருந்ததால் பல முறை முயன்றும் பலனில்லாததால் இம்முயற்சியை நான்குமுறை கிடப்பில் போட்டேன். இலக்கணங்களைக் கற்கவும், சேகரிக்கவும், பயன்படுத்தவும் தீவிரம் காட்டினேன். தமிழ் விக்கிப்பீடியாவில் தொடர்ந்து எழுதி வந்ததால் பிழைகளைக் கண்டுணர்ந்து அதிகமாகக் கற்க முடிந்தது. ஒரு கட்டத்தில் தமிழ் விக்கிப்பீடியாவின் தன்னாட்சியான மொழிநடையில் மாற்றுக் கருத்து ஏற்பட்டு அங்கு எழுதுவதை நிறுத்தினேன்.

இந்தத் திடீர் ஓய்வு சந்திப்பிழை திருத்தி உருவாக்க மீண்டும் ஒரு வாய்ப்பாக அமைந்தது. இம்முறை மாதிரி சொற்கூறுகள் கொண்டு பிழைகளைத் திருத்தும் ஒரு யுக்தியை முயன்று பார்த்தேன். அது சிறப்பான விளைவுகளைத் தந்தது. ஒரு சொல் என்ன இலக்கணத்தில் வருகிறது என்பதை மற்றொரு மாதிரி மூலம் அதைக் கணித்து அதற்கேற்ப சந்தி இலக்கணத்தைப் போட்டால் அதன் பலன் 90% சரியாகவே இருந்தது. மீதிச் சொற்களைச் சந்தேகச் சொற்களாக அக்கருவி காட்டி விளக்கத்தையும் கொடுக்கும். இணையத்தில் வேறு கருவிகள் இல்லாததால் எனக்காக உருவாக்கிய “நாவி” பிழை திருத்தியைப் பொதுப்பயன்பாட்டிற்கு வெளியிட்டேன். ஒரு முழுமையான பிழைதிருத்தி உருவாக்கும் பயணத்தில் நாவி ஒரு சிறிய இளைப்பாறுதல் என்றே எண்ணிக்கொண்டேன். அது ஜாவாஸ்கிரிப்ட் என்ற சாதாரண நிரல் மொழியில் எழுதப்பட்டது. ஆய்விற்குத்தான் ஓராண்டு ஆனது. ஆனால் மென்பொருளை உருவாக்க ஒருவாரமே போதுமானது. அவ்வப்போது இதனை மேம்படுத்தி வந்ததால் இது பலரையும் சென்றடைந்தது. கணித்தமிழ் செயல்பாட்டாளர்கள் பலரது தொடர்பு கிடைத்தது.

இணையத்தில் இயங்கிவந்த இதரக் கட்டற்ற மென்பொருள் குழுவில் இணைந்து முழுமையான திருத்தி உருவாக்கலாம் என்று நினைத்தால் அங்கே பங்களிக்கும் அளவிற்கு நிரல்மொழிகள் எனக்குத் தெரியவில்லை. காலப்போக்கில் கூகிள் ஆப்ஸ் ஸ்கிரிப்ட் நிரல் மொழியைக் கற்கத் தொடங்கினேன். நண்பரொருவருக்கு அங்கிருந்து விக்சனரிக்காக ஒரு தானியங்கி உருவாக்கி இணைய அகராதியிலிருந்து தமிழ்ச் சொற்களை எடுத்துத் தந்தேன். அந்தத் தரவுதான் பின்னாளில் எழுத்துப் பிழை திருத்திக்கு அடிப்படைச் சொற்பட்டியலானது. மொழியியல் ஆய்வுகள்படி தமிழில் பிழை திருத்தி உருவாக அடிப்படைச் சொல்லில் இருந்து கணினிக்குக் கற்றுத் தரவேண்டும் என்கிறது. ஆனால் எனக்கு வேண்டியதோ எழுத்துப்பிழை திருத்திதான் அதற்கான குறுக்குவழிகளைத் தேடத்தொடங்கினேன். கற்றுக் கொள்ளவும், இயக்கிக் கொள்ளவும் இணையத்தில் வசதிஇருந்ததால் கூகிள் ஆப்ஸ் ஸ்கிரிப்ட் மொழியிலேயே ஒரு திருத்தி உருவாக்கினேன். அடிப்படையில் தமிழின் ஒவ்வொரு சொல்லும் பலவிதங்களில் பல்வேறு சொல்லுடன் புணருவதால் இதன் சொல் எண்ணிக்கை என்பது அளவிற்கதிகமானது. எனவே கணினியை மனதில் கொண்டு ஒவ்வொரு சொல்லிற்கும் ஒரு வேர்ச் சொல்லைத் தீர்மானித்தேன் அந்த வேர்ச் சொல்லை ஒரு சொற்குடும்பப் பட்டியலில் இணைத்தேன். இப்படி ஒரே மாதிரி புணரக் கூடியச் சொற்களை ஒரே குடும்பத்தில் இட்டு அந்தக் குடும்பம் எப்படிப் பெருகும் என்று கணினிக்கு விளக்கி ஒரு இணையச் செயலியை உருவாக்கினேன். இது எந்தளவிற்குச் சிறப்பாக இருக்கிறதென்பதை அதன் சரியான வகைப்படுத்தலே தீர்மானிக்கும். அதற்காகத் தனியாக ஒரு தானியங்கி உருவாக்கி இணையத்தில் உள்ள ஒவ்வொரு இணையத்தளத்திலும் ஏவிவிட்டு அதன் சொற்களை இக்கருவியால் கணிக்க முடிகிறதா எனச் சோதித்து, சோதித்துப் புதிய சொற்களையும் சேகரித்தேன். ஆரம்பத்தில் இருந்த சொற்பட்டியலைவிட இப்படி இணையத்தில் தவழ்ந்து சேகரித்த சொற்கள் அதிகம்.

தற்போதுவரை கணினிக்கு எந்தச் சொல் தமிழ்ச் சொல் என்று கற்றுக்கொடுத்தாயிற்று. ஆனால் பிழைதிருத்தியின் முக்கியப் பணி சரியான சொற்களைப் பரிந்துரைப்பதாகும். மீண்டும் இதே தானியங்கி துணைகொண்டு தமிழில் அதிகமாகப் பிழைவிட்டு எழுதும் இணைய தளங்களில் ஆய்வுசெய்தேன். முக்கிய பிழைகள் என்றால் முதலில் ஒற்றுப்பிழை. அடுத்து ல/ள/ழ ன/ண போன்ற ஒலிப்புப்பிழை. அடுத்து வீடு/வீட்டு போன்ற புணர்ச்சிப்பிழை. கடைசியில்தான் இதரப் பிழைகள் வந்தன. அந்தாய்வின் அடிப்படையில் சில நெறிமுறைகளை வகுத்து பரிந்துரைகளை உருவாக்கினேன். அக்கருவியின் வேகம், திறன் போன்ற சவால்களை அமைப்பு ரீதியாக எதிர்கொண்டாலும் நுட்பரீதியாக இந்த நிரல்மொழி உதவவில்லை. அதற்காக வாணியின் வெளியீடு ஓராண்டு தள்ளிப் போனது. இக்காலகட்டத்தில் டாட் நெட் மற்றும் சி++ கற்று அதில் இக்கருவியை உருவாக்கி இணையத்தில் வெளியிட்டேன். இன்னும் ஆய்வுகள் எல்லாம் கூகிள் ஆப்ஸ் ஸ்கிரிப்ட்டிலும், வெளியீடு மட்டும் சி++விலும் நிகழ்கிறது.

தமிழிலும் கணினியிலும் எனக்குப் பட்டக் கல்வி இல்லை என்பதாலும், தனியார் அல்லது அரசு அமைப்புகளில் உறுப்பினர் இல்லை என்பதாலும்  இயல்பாக நிகழக்கூடிய புறக்கணிப்புகள் தாண்டிப் பல அங்கீகாரங்களை இக்கருவிகள் பெற்றுத் தந்துள்ளன. தொழில்ரீதியான தொடர்பில்லாததால் கட்டணம் செலுத்தி எனது ஆய்வுகளை ஆய்விதழ்களில் வெளியிடவோ, கருவி பற்றிய விளம்பரங்கள் செய்யவோ விரும்பவில்லை. அதிகமான தமிழ்க்கணிமை தொடர்பான கருவிகள் உருவாக வேண்டும் என்ற அடிப்படையில் வணீக நோக்கமில்லாமல் ஒத்த சிந்தனையுடையவர்களிடம் இவ்வாய்வுகளையும் நிரல்களையும் பகிர்ந்துகொள்கிறேன். இக்கருவிகளும் பெரிய இலக்கை நோக்கிய பயணத்தில் சிறிய இளைப்பாறுதல்தான். அடுத்து இலக்கணப் பிழை திருத்தி உருவாக்க இலக்குள்ளது. இடையில் ஒளிவழி எழுத்துணரி (OCR) தொடர்பான ஆய்வுகள் மகிழ்ச்சியான விளைவைக் கொடுத்துவருகின்றன. இக்கருவியும் முந்தைய ஆய்வுகளைப் பின்பற்றாமல் புதிய வழிகளில் முயல்கிறேன். எனவே எழுத்துணரி கருவி அடுத்த முக்கிய வெளியீடாக இருக்கும். அதுவரை தொடர்ந்து ஆலோசனைகளையும், ஆதரவையும் இக்கருவிகளுக்குத் தாருங்கள்.

நீச்சல்காரன்

[email protected]