La lingüística de corpus parte de la base de que la descripción de una lengua no puede llevarse a cabo exclusivamente mediante la intuición del hablante nativo, sino que requiere también de un conjunto de muestras reales.
El COLEM es un corpus de lengua hablada, fruto de una serie de entrevistas semidirigidas grabadas en entorno natural, de una hora de duración aproximadamente y estructuradas en función de un protocolo de encuesta común. El estilo que recoge es el conversacional y familiar (habla espontánea).
Para conseguir una muestra representativa y homogénea, la selección de informantes (primera y segunda generación de inmigrantes) se realiza a partir de criterios sociolingüísticos (origen, sexo-género, edad, nivel de instrucción), de los propios de las situaciones de contacto lingüístico (español-francés-inglés) y de la migración (edad al llegar, bilingüismo o no al llegar, oficios ejercidos, entorno familiar).
El objetivo final del COLEM es obtener una serie de muestras amplias de la lengua española hablada en Montreal (Région métropolitaine de Montréal) a partir de las cuales pueda extraerse información lingüística, en todos los niveles de análisis, para su posterior descripción y caracterización. Los materiales sirven también a otras disciplinas como la sociología, la antropología, la política y las relaciones internacionales.
La linguistique de corpus repose sur l'hypothèse que la description d'une langue ne peut se faire exclusivement au moyen de l'intuition du locuteur natif, mais nécessite également un ensemble d'échantillons réels.
Le COLEM est un corpus de langue parlée, résultat d'une série d'entretiens semi-dirigés enregistrés dans un environnement naturel, d'une durée d'environ une heure et structurés selon un protocole d'enquête commun. Le style recueilli est conversationnel et familier (discours spontané).
Afin d'obtenir un échantillon représentatif et homogène, la sélection des informateurs (immigrés de première et deuxième génération) est basée sur des critères sociolinguistiques (origine, sexe, genre, âge, niveau d'éducation), ceux propres aux situations de contact linguistique (espagnol-français-anglais) et de migration (âge à l'arrivée, bilinguisme ou non à l'arrivée, professions exercées, environnement familial).
L'objectif ultime du COLEM est d'obtenir une série de larges échantillons de la langue espagnole parlée à Montréal (Région métropolitaine de Montréal) à partir desquels des informations linguistiques peuvent être extraites, à tous les niveaux d'analyse, en vue d'une description et d'une caractérisation ultérieures. Le matériel sert également à d'autres disciplines telles que la sociologie, l'anthropologie, la politique et les relations internationales.