Descrição
O corpus de narrativas escritas é um corpus de textos produzidos por crianças do 1.º ciclo (2.º e 3.º anos de escolaridade) obtidos no âmbito do PIPALE, como resposta a um item de escrita compositiva incluído no instrumento de diagnóstico desenvolvido neste projeto.
O Instrumento de diagnóstico PIPALE é composto por quatro Cadernos, cada um dedicado à avaliação de diferentes domínios da consciência linguística. O item correspondente à tarefa de escrita está incluído no Caderno 4 do instrumento de diagnóstico e elicita a produção de um breve texto narrativo a partir de uma sequência de três imagens, como exemplificado abaixo. Cada uma das imagens poderá ser associada a um momento-chave da narrativa: situação inicial, situação problemática e respetiva resolução.
Existem várias versões do instrumento de diagnóstico PIPALE, pelo que a sequência de imagens poderá ser diferente. Contudo, a instrução dada às crianças é sempre idêntica: “Observa as imagens. Escreve uma história a partir da sequência de imagens. Dá um título à tua história”. Após a instrução e a sequência de imagens, é incluído um espaço para a escrita do texto correspondente a dez linhas.
No que diz respeito aos procedimentos de aplicação, a tarefa de escrita é aplicada em sala de aula pelos professores titulares de turma, com o apoio da equipa do PIPALE. A recolha é efetuada em quatro momentos: no início e no fim do 2.º ano de escolaridade e no início e no fim do 3.º ano de escolaridade.
O corpus está em permanente atualização, com a inclusão de novos textos em cada ano letivo. Neste momento, compreende narrativas produzidas entre 2019 e 2024, por alunos de agrupamentos de escolas do Município de Sesimbra e do Município do Seixal.
Cada texto recolhido foi digitalizado e transcrito, encontrando-se anonimizado e acompanhado de metadados, com informação sobre o perfil sociolinguístico de cada criança e o contexto de recolha dos dados.
Corpus de narrativas escritas | ||||||
Versão do Instrumento de diagnóstico PIPALE | N.º de textos | N.º de palavras | ||||
2.º ano | 3.º ano | Total | 2.º ano | 3.º ano | Total | |
Instrumento 1 | 158 | – | 158 | 5324 | – | 5324 |
Instrumento 2 | 145 | 82 | 227 | 7170 | 6194 | 13364 |
Instrumento 3 | 72 | – | 72 | 4883 | – | 4883 |
Instrumento 4 | 80 | 84 | 164 | 3809 | 4705 | 8514 |
Instrumento 5 | 68 | 73 | 141 | 5352 | 5622 | 10974 |
Instrumento 6 | 202 | 87 | 289 | 7663 | 6676 | 14339 |
Instrumento 7 | 131 | 64 | 195 | 9599 | 6098 | 15697 |
TOTAL | 856 | 390 | 1246 | 43800 | 29295 | 73095 |
Acesso
O corpus será disponibilizado em formato .txt e .cha, de acordo com as normas do sistema CHILDES (Child Language Data Exchange System) e com recurso ao software CLAN (MacWhinney 2000). Os textos em formato .cha incluirão uma versão normalizada ortograficamente de cada texto e anotação sintática.