| Relatório de Reunião
– Grupo Comtec
Dia: 30 de março de 2005.
Local: Edifício Capa, UMESP.
Presentes: Silma Cortês Battezati, Joaquim Valverde,
Eduardo Penterich e Flávio Archangelo.
Temas:
1 – Digitalização do acervo –
Database
Joaquim Valverde, seguindo encontros informais anteriores
com Flávio e Silma, descreveu a integração
dos seguintes sistemas implementados no SPET como adequados
para o database Comtec:
- Busca online da biblioteca, com campos para autores,
títulos, ISSN/ISBN, assuntos, keywords, etc.
- Estrutura de exibição dos arquivos digitais
das disciplinas oferecidas por aquela instituição
(“Unidade Aula”, segundo Penterich o correspondente
aos “objetos de aprendizado” na Metodista).
Assim, ao invés dos livros da biblioteca e os conteúdos
das disciplinas, o novo sistema integrado funcionaria como
busca e armazenamento do database Comtec.
Valverde descreveu dois processos de digitalização
e arquivamento a ser escolhido ou conjugado pelo grupo:
a) Digitalização dos artigos como imagem jpeg.
O artigo é digitalizado como imagem. Para cada arquivo
são redigidos os dados para a catalogação
como autores, título, editora, etc, bem como os assuntos
e as famílias/sub-famílias ao qual o texto
se insere.
Pontos a serem considerados:
- O banco de dados exigirá máquinas com maior
capacidade de armazenamento pois as imagens são mais
“pesadas” em kB,
- O "donwload" do artigo será lento,
- As buscas não poderão ser por expressões
ou palavras “intra-texto” pois os artigos por
inteiro serão considerados imagens.
Outras colocações:
- Silma considera a seleção de keywords como
críticas pois exige a leitura qualificada e tradução
adequada dos termos e conceitos empregados em um texto especializado.
Flávio
considera que, além das keywords, a seleção
das sub-famílias é uma interpretação
limitada do acervo já que muitos artigos são
jornalísticos e de múltiplas categorizações,
com muitas
abordagens e correlações, sendo legítima
a sua inserção em várias sub-família.
Ambos concordam que, independente do sistema a ser empregado,
no site do grupo deve-se orientar previamente o pesquisador
para esta questão. Valverde relevou a baixa velocidade
no carregamento do arquivo.
b) Digitalização dos artigos como arquivo
pdf.
O artigo é digitalizado e novamente editado para
identificar o que é texto e imagens dentro do arquivo
pdf, que trabalha os elementos vetorialmente.
Pontos a serem considerados:
- O banco de dados exigirá máquinas de menor
capacidade de armazenamento se comparadas com a opção
“a”, pois o arquivo pdf é menor em kB;
- O "download" é mais rápido;
- As buscas podem ser por expressões ou palavras
“intra-texto”;
- O longo tempo destinado a edição de cada
página a ser digitalizada. Penterich considerou o
processo de editoração composto pelas ações
de verificação ortográfica, a nova
diagramação e a geração do arquivo
em pdf, que levaria por volta de 1 hora por página;
- Flávio acrescentou a necessidade de redigir os
dados de catalogação, como na opção
anterior.
Outras colocações:
- Todos concordaram com a necessidade de mais colaboradores
devido o tempo na edição destes arquivos,
sugerindo a participação dos alunos em iniciação
científica em áreas/faculdades correlatas.
Seguindo a exploração das duas possibilidades,
foram levantadas as seguintes soluções:
- Penterich sugeriu o servidor da Maxihost, que hospeda
o site Comtec, para armazenar fisicamente o banco de dados.
Valverde orientou Flávio para entrar em contato com
o provedor para questionar uma possível “aplicação
escrita em Java de busca (JSP) e com acesso a banco de dados
SQL (My SQL)”.
- Valverde sugeriu a Penterich inclusão de um servidor
com conexão a RNP, dedicada à pesquisa no
Brasil, em seu trabalho junto a Fapesp.
- Penterich e Silma comentaram que alguns artigos já
podem estar disponíveis na internet, como a Info
Exame, cujas referências no database poderiam remeter
a esses links.
Flávio trouxe um CD com várias digitalizações
de 2 textos do acervo (um basicamente formado por imagens
e outro com diagramação mais tradicional,
encontrada em jornais) para considerar quantos kB corresponde
um arquivo com tal característica visual e precisão
empregada no scanner. Valverde levou o material para estudo.
2 – Outros temas, informes, sugestões de palestras,
pesquisas.
Silma trouxe outros temas a serem tratados também
nas próximas reuniões com a presença
do líder: a possível palestra do Dr. Sérgio
Luiz Gadini (UEPG) e considerações
sobre o seu projeto de pesquisa no Comtec a respeito de
Software Livre – Software Proprietário, cujo
prévio material já foi disponibilizado em
reuniões anteriores. Penterich recebeu uma nova cópia
do material para avaliar como poderia colaborar, inclusive
em suas aulas em RTV.
Silma exibiu uma apostila do governo federal a respeito
de Software Livre.
Flávio trouxe a última edição
da revista Elektor e um pequeno circuito relacionado ao
Digital Radio Mondiale, manifestando interesse em trazer
o técnico Marcus Ramos para palestra e demonstração
da recepção DRM na Metodista.
:: Fim ::
|