నైరూప్య

Automatic Language Identification from Written Texts ? An Overview

H L Shashirekha

Language Identification is the task of automatically identifying the language(s) in which the content is written in a document (web page, text document). Due to the widespread use of internet, identification of languages has become an important preprocessing step for a number of applications such as machine translation, Part-of-Speech tagging, linguistic corpus creation, supporting low-density languages, accessibility of social media or user-generated content, search engines and information extraction in addition to processing multilingual documents. In a multilingual country like India, Language Identification has wider scope to bridge the digital divide between different language users. This paper presents a brief overview of the challenges involved in automatic language identification, existing methodologies and some of the tools available for language identification.

నిరాకరణ: ఈ సారాంశం ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ టూల్స్ ఉపయోగించి అనువదించబడింది మరియు ఇంకా సమీక్షించబడలేదు లేదా నిర్ధారించబడలేదు

ఇండెక్స్ చేయబడింది

Index Copernicus
Academic Keys
CiteFactor
కాస్మోస్ IF
RefSeek
హమ్దార్డ్ విశ్వవిద్యాలయం
వరల్డ్ కేటలాగ్ ఆఫ్ సైంటిఫిక్ జర్నల్స్
ఇంటర్నేషనల్ ఇన్నోవేటివ్ జర్నల్ ఇంపాక్ట్ ఫ్యాక్టర్ (IIJIF)
ఇంటర్నేషనల్ ఇన్స్టిట్యూట్ ఆఫ్ ఆర్గనైజ్డ్ రీసెర్చ్ (I2OR)
కాస్మోస్

మరిన్ని చూడండి