Descrição

O corpus de narrativas escritas é um corpus de textos produzidos por crianças do 1.º ciclo (2.º e 3.º anos de escolaridade) obtidos no âmbito do PIPALE, como resposta a um item de escrita compositiva incluído no instrumento de diagnóstico desenvolvido neste projeto.

O Instrumento de diagnóstico PIPALE é composto por quatro Cadernos, cada um dedicado à avaliação de diferentes domínios da consciência linguística. O item correspondente à tarefa de escrita está incluído no Caderno 4 do instrumento de diagnóstico e elicita a produção de um breve texto narrativo a partir de uma sequência de três imagens, como exemplificado abaixo. Cada uma das imagens poderá ser associada a um momento-chave da narrativa: situação inicial, situação problemática e respetiva resolução.

Existem várias versões do instrumento de diagnóstico PIPALE, pelo que a sequência de imagens poderá ser diferente. Contudo, a instrução dada às crianças é sempre idêntica: “Observa as imagens. Escreve uma história a partir da sequência de imagens. Dá um título à tua história”. Após a instrução e a sequência de imagens, é incluído um espaço para a escrita do texto correspondente a dez linhas.

No que diz respeito aos procedimentos de aplicação, a tarefa de escrita é aplicada em sala de aula pelos professores titulares de turma, com o apoio da equipa do PIPALE. A recolha é efetuada em quatro momentos: no início e no fim do 2.º ano de escolaridade e no início e no fim do 3.º ano de escolaridade.

O corpus está em permanente atualização, com a inclusão de novos textos em cada ano letivo. Neste momento, compreende narrativas produzidas entre 2019 e 2024, por alunos de agrupamentos de escolas do Município de Sesimbra e do Município do Seixal.

Cada texto recolhido foi digitalizado e transcrito, encontrando-se anonimizado e acompanhado de metadados, com informação sobre o perfil sociolinguístico de cada criança e o contexto de recolha dos dados.

Corpus de narrativas escritas

Versão do Instrumento de diagnóstico PIPALE

N.º de textos

N.º de palavras

2.º ano

3.º ano

Total

2.º ano

3.º ano

Total

Instrumento 1

158

158

5324

5324

Instrumento 2

145

82

227

7170

6194

13364

Instrumento 3

72

72

4883

4883

Instrumento 4

80

84

164

3809

4705

8514

Instrumento 5

68

73

141

5352

5622

10974

Instrumento 6

202

87

289

7663

6676

14339

Instrumento 7

131

64

195

9599

6098

15697

TOTAL

856

390

1246

43800

29295

73095

Acesso

O corpus será disponibilizado em formato .txt e .cha, de acordo com as normas do sistema CHILDES (Child Language Data Exchange System) e com recurso ao software CLAN (MacWhinney 2000). Os textos em formato .cha incluirão uma versão normalizada ortograficamente de cada texto e anotação sintática.