// Copyright (c) 2008 Pedro Quaresma, Coimbra, Portugal // Versão 2.0 // versão 1.0, desenvolvida por Augusto Pinho // (sob supervisão de Pedro Quaresma) %{ #include /* os índices do vector vão coincidir com os valores da codificação dos caracteres, que no caso dos caracteres acentuados é ajustada de forma a não haver conflitos, 122+1+32 = 155, isto dado não se poderem considerar índices negativos. O gasto de memória que esta solução implica não é (muito) significativo. */ #define MAXCOD 155 int paraminuscula(char c) { /* A diferença entre letras maiúsculas e minúsculas é de 32, no caso das letras não acentuadas pode-se usar a função pré-definida tolower, no caso das letras acentuadas essa função não faz nada */ if (c >= -64 && c <= -36) return(c+32); else return(c); } %} double conta_trigramas=0; double conta_trigramasT=0; int i=0; int j=0; int l=0; int m=0; int n=0; int k=0; int Letr3 [MAXCOD][MAXCOD][MAXCOD]; char ch1; char ch2; letras [a-zA-Z]|"á"|"à"|"ã"|"â"|"ç"|"é"|"è"|"ê"|"í"|"ì"|"ó"|"ò"|"õ"|"ô"|"ú"|"ù"|"ü"|"Á"|"À"|"Ã"|"Â"|"Ç"|"É"|"È"|"Ê"|"Í"|"Ì"|"Ó"|"Ò"|"Õ"|"Ô"|"Ú"|"Ù"|"Ü" %% {letras}{3} { if(yytext[0]<0) i =-1*paraminuscula(yytext[0])+123; else i=tolower(yytext[0]); if(yytext[1]<0) j =-1*paraminuscula(yytext[1])+123; else j=tolower(yytext[1]); if(yytext[2]<0) n =-1*paraminuscula(yytext[2])+123; else n=tolower(yytext[2]); Letr3[i][j][n]=Letr3[i][j][n]+1; // Depois de precessados temos de voltar a colocar na sequência // de entrada o último e o penúltimos caracteres lidos, isto para // que os mesmos sejam considerados para o próximo trigrama. unput(yytext[2]); unput(yytext[1]); } .|\n %% main(int argc, char *argv[]) { // interface linha de comando // media char *ficheiroEntrada,*ficheiroSaida; FILE *fsai, *fopen(); if (argc<=2) { // valores de entrada insuficientes (2+1) printf("\nUtilização: trigramas nome_ficheiro_entrada nome_ficheiro_saída\n\n"); return; } // obtêm os argumentos da linha de comando ficheiroEntrada=argv[1]; ficheiroSaida=argv[2]; printf ("\nFicheiro a Processar: %s\nFicheiro com resultados: %s\n\n",ficheiroEntrada,ficheiroSaida); if ((yyin = fopen(ficheiroEntrada,"r")) == NULL) { printf("Não foi possível abrir o ficheiro %s\n",ficheiroEntrada); } else if ((fsai = fopen(ficheiroSaida,"w")) == NULL) { printf("Não foi possível abrir para escrita o ficheiro %s\n",ficheiroSaida); } else { // processar yylex(); //conta números de trigramas conta_trigramas=0; conta_trigramasT=0; for (i=0; i < MAXCOD; i++) for(j=0;j < MAXCOD; j++) for(n=0;n < MAXCOD; n++) { if(Letr3[i][j][n]!=0) { conta_trigramas=conta_trigramas+1; conta_trigramasT=conta_trigramasT+Letr3[i][j][n]; } } for (i=0; i < MAXCOD; i++) for(j=0;j < MAXCOD; j++) for(n=0;n < MAXCOD; n++) { if(Letr3[i][j][n]!=0) { if (i>123) k=-1*(i-123); else k=i; if (j>123) l=-1*(j-123); else l=j; if (n>123) m=-1*(n-123); else m=n; fprintf(fsai,"%c%c%c\t%0.6f\n",k,l,m,(Letr3[i][j][n]/conta_trigramasT)*100); } } } }