Reunião dia 30 de março de 2005
 

Relatório de Reunião – Grupo Comtec
Dia: 30 de março de 2005.
Local: Edifício Capa, UMESP.
Presentes: Silma Cortês Battezati, Joaquim Valverde, Eduardo Penterich e Flávio Archangelo.

Temas:

1 – Digitalização do acervo – Database

Joaquim Valverde, seguindo encontros informais anteriores com Flávio e Silma, descreveu a integração dos seguintes sistemas implementados no SPET como adequados para o database Comtec:

- Busca online da biblioteca, com campos para autores, títulos, ISSN/ISBN, assuntos, keywords, etc.

- Estrutura de exibição dos arquivos digitais das disciplinas oferecidas por aquela instituição (“Unidade Aula”, segundo Penterich o correspondente aos “objetos de aprendizado” na Metodista).

Assim, ao invés dos livros da biblioteca e os conteúdos das disciplinas, o novo sistema integrado funcionaria como busca e armazenamento do database Comtec.

Valverde descreveu dois processos de digitalização e arquivamento a ser escolhido ou conjugado pelo grupo:


a) Digitalização dos artigos como imagem jpeg.

O artigo é digitalizado como imagem. Para cada arquivo são redigidos os dados para a catalogação como autores, título, editora, etc, bem como os assuntos e as famílias/sub-famílias ao qual o texto se insere.

Pontos a serem considerados:

- O banco de dados exigirá máquinas com maior capacidade de armazenamento pois as imagens são mais “pesadas” em kB,
- O "donwload" do artigo será lento,
- As buscas não poderão ser por expressões ou palavras “intra-texto” pois os artigos por inteiro serão considerados imagens.

Outras colocações:

- Silma considera a seleção de keywords como críticas pois exige a leitura qualificada e tradução adequada dos termos e conceitos empregados em um texto especializado. Flávio
considera que, além das keywords, a seleção das sub-famílias é uma interpretação limitada do acervo já que muitos artigos são jornalísticos e de múltiplas categorizações, com muitas
abordagens e correlações, sendo legítima a sua inserção em várias sub-família. Ambos concordam que, independente do sistema a ser empregado, no site do grupo deve-se orientar previamente o pesquisador para esta questão. Valverde relevou a baixa velocidade no carregamento do arquivo.


b) Digitalização dos artigos como arquivo pdf.

O artigo é digitalizado e novamente editado para identificar o que é texto e imagens dentro do arquivo pdf, que trabalha os elementos vetorialmente.

Pontos a serem considerados:

- O banco de dados exigirá máquinas de menor capacidade de armazenamento se comparadas com a opção “a”, pois o arquivo pdf é menor em kB;
- O "download" é mais rápido;
- As buscas podem ser por expressões ou palavras “intra-texto”;
- O longo tempo destinado a edição de cada página a ser digitalizada. Penterich considerou o processo de editoração composto pelas ações de verificação ortográfica, a nova diagramação e a geração do arquivo em pdf, que levaria por volta de 1 hora por página;
- Flávio acrescentou a necessidade de redigir os dados de catalogação, como na opção anterior.

Outras colocações:

- Todos concordaram com a necessidade de mais colaboradores devido o tempo na edição destes arquivos, sugerindo a participação dos alunos em iniciação científica em áreas/faculdades correlatas.


Seguindo a exploração das duas possibilidades, foram levantadas as seguintes soluções:

- Penterich sugeriu o servidor da Maxihost, que hospeda o site Comtec, para armazenar fisicamente o banco de dados. Valverde orientou Flávio para entrar em contato com o provedor para questionar uma possível “aplicação escrita em Java de busca (JSP) e com acesso a banco de dados SQL (My SQL)”.

- Valverde sugeriu a Penterich inclusão de um servidor com conexão a RNP, dedicada à pesquisa no Brasil, em seu trabalho junto a Fapesp.

- Penterich e Silma comentaram que alguns artigos já podem estar disponíveis na internet, como a Info Exame, cujas referências no database poderiam remeter a esses links.

Flávio trouxe um CD com várias digitalizações de 2 textos do acervo (um basicamente formado por imagens e outro com diagramação mais tradicional, encontrada em jornais) para considerar quantos kB corresponde um arquivo com tal característica visual e precisão empregada no scanner. Valverde levou o material para estudo.


2 – Outros temas, informes, sugestões de palestras, pesquisas.

Silma trouxe outros temas a serem tratados também nas próximas reuniões com a presença do líder: a possível palestra do Dr. Sérgio Luiz Gadini (UEPG) e considerações
sobre o seu projeto de pesquisa no Comtec a respeito de Software Livre – Software Proprietário, cujo prévio material já foi disponibilizado em reuniões anteriores. Penterich recebeu uma nova cópia do material para avaliar como poderia colaborar, inclusive em suas aulas em RTV.

Silma exibiu uma apostila do governo federal a respeito de Software Livre.

Flávio trouxe a última edição da revista Elektor e um pequeno circuito relacionado ao Digital Radio Mondiale, manifestando interesse em trazer o técnico Marcus Ramos para palestra e demonstração da recepção DRM na Metodista.

:: Fim ::

 
     
 
Home > Sobre > Reuniões
 


 
-------------------------------------------------------------------------------------------------------------
:: COMTEC :: Grupo de Pesquisa em Comunicação e Tecnologias Digitais :: comtec.pro.br ::