Aquisição dos dados

Conceito de grupo

A definição metodológica mais importante na constituição da base de dados é a de sua unidade de análise. O grupo de pesquisa foi definido como um conjunto de indivíduos organizados hierarquicamente:

  • Cujo fundamento organizador são a experiência, o destaque e a liderança no terreno científico ou tecnológico;
  • Em que há envolvimento profissional e permanente com atividades de pesquisa;
  • No qual o trabalho se organiza em torno de linhas comuns de pesquisa; e
  • Que, em algum grau, compartilha instalações e equipamentos.

Cada grupo de pesquisa deve, portanto, organizar-se em torno de uma liderança (eventualmente duas), que é a fonte das informações constantes na base de dados. O conceito de grupo admite aquele composto de apenas um pesquisador. Na quase totalidade dos casos, esses grupos se compõem do pesquisador e de seus estudantes.

Coleta e atualização de dados
As informações são colhidas por meio de um questionário eletrônico padronizado que o CNPq disponibiliza aos Líderes de grupo previamente cadastrados no sistema pelos Dirigentes de Pesquisa das Instituições participantes. Esses dirigentes, pró-reitores, superintendentes, diretores ou vice-presidentes de pesquisa, etc, são também encarregados de certificar os grupos de pesquisa após o envio dos dados pelos líderes.

A seqüência de eventos na aquisição de dados do Diretório, realizada por meio do site denominado Coleta de dados(*), é a seguinte:

  • O CNPq, com base em regras definidas e divulgadas no site de Coleta de dados, cadastra as Instituições Participantes e seus Dirigentes Institucionais de Pesquisa;
  • Os Dirigentes Institucionais de Pesquisa cadastrados recebem uma senha e passam a ter acesso a uma página na Internet (o site de Dirigentes) para gerenciar a aquisição e atualização dos dados dos grupos de suas instituições;
  • Através desses sites, os Dirigentes cadastram os Líderes dos grupos de pesquisa de suas instituições na base de dados. Para serem cadastrados, os líderes precisam ter um Currículo Lattes no CNPq;
  • Esses líderes, através de site específico disponibilizado pelo CNPq, têm acesso (senha Lattes) ao formulário eletrônico dos grupos de pesquisa, preenchem os dados nele requeridos e os enviam ao CNPq;
  • Os dirigentes institucionais, em contato com a base de dados através de seus sites, certificam ou não os grupos de sua instituição, cujos dados foram enviados pelos líderes. Somente grupos certificados pelos dirigentes são considerados pelo CNPq;
  • Os líderes, através de seu site, podem acompanhar a situação de seus grupos na base de dados, verificando o status em que se encontram (certificado, certificação negada ou aguardando certificação); atualizar dados do seu grupo de forma on-line; enviar e-mails ao seu dirigente de pesquisa e aos pesquisadores do seu grupo e, se necessário, excluir um grupo sob sua liderança da base de dados;
  • Pesquisadores e estudantes precisam ter Currículo Lattes para serem cadastrados em grupos de pesquisa e poderem visualizar os dados do(s) grupo(s) de que participam, também por meio de sites específicos disponibilizados pelo CNPq. Além disso, um pesquisador ou estudante, incluído indevidamente em um grupo de pesquisa, pode retirar-se unilateralmente desse grupo.

Desta forma, o cadastramento dos líderes dos grupos e a certificação dos grupos são responsabilidades dos dirigentes de pesquisa das instituições participantes. As informações referentes ao grupo (pesquisadores, estudantes, pessoal de apoio técnico e linhas de pesquisa) são de responsabilidade dos líderes dos grupos. Alguns dados pessoais sobre os pesquisadores e os estudantes, como titulação, nível de treinamento dos estudantes, idade e sexo, e aqueles relativos à produção científica, tecnológica e artística são de responsabilidade de cada líder, pesquisador e estudante, que os informam em seus Currículos Lattes.

O Diretório é, portanto, uma atividade compartilhada entre vários atores que têm acesso a uma mesma base de dados fisicamente localizada no CNPq. Essa base de dados, continuamente atualizada, é a denominada Base Corrente e suas “fotografias”, feitas periodicamente, correspondem aos Censos.

O Censo de 2000 coletou informações sobre os grupos no primeiro semestre de 2000 e extraiu a produção científica, tecnológica e artística dos participantes dos grupos, do período de 1997 a 2000, da base de currículo Lattes existente no CNPq em 01 de junho de 2001.

O censo de 2002 teve como data base o dia 15 de julho de 2002 (quando foi feita a “fotografia” da Base Corrente do Diretório) e a produção C,T&A foi extraída dos currículos Lattes dos integrantes dos grupos no dia 22 de julho do mesmo ano, correspondendo ao quadriênio 1998-2001.

O censo de 2004 contém informações sobre os grupos existentes na base corrente do Diretório em 21 de outubro de 2004 e a produção C,T&A existente na base de currículos Lattes no dia 9 de dezembro de 2004, correspondente ao quadriênio 2000–2003.

O Censo 2006 contém informações sobre os grupos certificados existentes na base corrente do Diretório em 04 de dezembro de 2006 e a produção C,T&A existente na base de currículos Lattes no dia 12 de setembro de 2007, correspondente ao quadriênio 2003–2006.

Em 2008, a base censitária é composta pelos grupos certificados existentes na base corrente do Diretório em 05 de dezembro de 2008 e pela produção C,T&A do quadriênio 2005–2008 existente na base de currículos Lattes em 29 de abril de 2009.

(*) Sistema utilizado a partir do Censo de 2002. Em 2000, o processo de coleta foi diferente, visto que os sistemas disponíveis na época eram outros, mas o processo de certificação e os conceitos envolvidos permanecem os mesmos.

Mudanças importantes introduzidas a partir de 2002
As definições básicas do Diretório e os objetivos que o movem continuam essencialmente os mesmos desde o seu início, em 1992, embora a logística da captura dos dados tenha mudado significativamente em 2002, como conseqüência natural do avanço dos sistemas de informação e da integração das bases de dados do CNPq no âmbito da Plataforma Lattes (mais informações sobre o projeto e o histórico da sua evolução podem ser obtidas nos links Apresentação e Histórico de Grupos de Pesquisa, em: http://lattes.cnpq.br/ .

Além da logística, mudanças relacionadas às regras de cadastro de grupos e à estrutura do formulário de coleta, que afetam diretamente a conformação da base de dados, foram introduzidas a partir do censo de 2002:

  • Foi tornado obrigatório aos pesquisadores e estudantes terem um currículo Lattes cadastrado no CNPq para participar do Diretório, tendo em vista a integração dos sistemas Grupo e de Currículo Lattes. Em 2000, embora fortemente recomendado, não era obrigatório. Isto significa que, no censo de 2000, existem integrantes de grupo sem CV Lattes e, portanto, sem a produção C&T, que era, e continua sendo, extraída dos currículos dos participantes; Outras informações, como a titulação, idade e sexo, que também são extraídas do CV Lattes, em 2000 eram requeridas no próprio formulário e a partir de 2002 foram dele excluídas;
  • Foram incluídas no formulário (módulo Empresas) informações sobre as relações de trabalho eventualmente existentes entre os grupos e o setor produtivo de bens e serviços;
  • Foi elaborada uma nova tabela de setores de aplicação, utilizada para relacionar as linhas de pesquisa do grupo. A nova tabela foi construída com base na Classificação Nacional de Atividades Econômicas do IBGE e é mais detalhada do que a que vinha sendo utilizada nos censos anteriores (onde era denominada de setores de atividade).

Revisão dos dados dos Censos - Histórico
Em 2004, as informações contidas nas bases de dados a partir de 2000 foram organizadas em um Data Warehouse, construído com o objetivo de oferecer uma rápida recuperação das informações contidas na base de dados e poder extrair informações de forma padronizada. Isto possibilitou também a apresentação dos resultados dos censos, a partir de 2000, em uma única ferramenta, que se constitui no presente site. Esse processo exigiu, em 2004, uma revisão metodológica em relação às tabulações dos dados e gerou, como conseqüência, mudanças em algumas tabelas já publicadas nos anos de 2000 e 2002. Alguns erros também foram encontrados e corrigidos.

A mudança mais importante ocorrida então foi em relação aos módulos de Empresas da Súmula e do Plano Tabular de 2002, cujos quantitativos referentes à forma de remuneração e ao tipo de relacionamento dos grupos com as empresas foram recalculados e retiradas as duplas contagens. Já a tabela de ramos de atividade econômica foi refeita separando o primeiro e o segundo níveis da tabela CNAE indicado pelos grupos (em 2002 essa tabela foi apresentada nos três níveis da tabela, porém sem distinção entre eles).

Alguns dados relativos a 2000 e 2002, que são extraídos da base dos currículos Lattes dos participantes, também podem ter sofrido alterações em 2004, em função de atualizações e inclusões de novos currículos.

Em 2006, por ocasião da publicação dos resultados do Censo desse ano, não houve nenhuma mudança importante e procedeu-se apenas correções em alguns dados dos censos anteriores relativos ao módulo de Séries Históricas.

Em 2008, foi feita uma revisão nos resultados do censo de 2006 e constatados alguns problemas nos módulos de Grupos/Empresas e Empresas/Grupos do Plano Tabular, já corrigidos.

Bases de dados complementares
Além das informações colhidas nos formulários dos grupos de pesquisa, outras informações que complementam as bases censitárias do Diretório são importadas da base de Currículo Lattes, do Sistema de Fomento do CNPq e da base do DATACAPES da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior-CAPES, e “congeladas” para a elaboração dos censos. Abaixo, o detalhamento da origem dos dados e as datas de referência:

  • Séries históricas, Súmula estatística e Plano tabular
    Informações provenientes da base de currículos Lattes, que são a produção C,T&A, a titulação máxima dos pesquisadores e o nível de treinamento dos estudantes:

    Censo 2000: dados existentes nos currículos em 01/06/2001, sendo que a produção abrange o quadriênio 1997-2000.
    Censo 2002: dados existentes nos currículos em 15/07/2002, sendo a produção do quadriênio 1998-2001.
    Censo 2004: dados existentes nos currículos em 11/12/2004, sendo a produção relativa ao quadriênio 2000-2003.
    Censo 2006: dados existentes nos currículos em 12/09/2007, produção relativa ao 2003-2006.
    Censo 2008: dados existentes nos currículos em 26/01/2009 e, para a produção C&T, quadriênio 2005-2008, a produção em 29/04/2009.

  • Busca textual
    Todas as informações provenientes da base de currículos Lattes, que são a produção C,T&A, a titulação máxima dos pesquisadores e o nível de treinamento dos estudantes, dos censos de 2000 a 2004, refletem os conteúdos dos currículos em 11/12/2004. Para os Censos de 2006 e 2008, as informações são as mesmas das Séries Históricas.

    As informações sobre bolsistas e orientadores do CNPq têm as seguintes datas de referência:
    Censo 2000: Novembro de 2000
    Censo 2002: Julho de 2002
    Censo 2004: Novembro de 2004
    Censo 2006: Dezembro de 2006
    Censo 2008: Janeiro de 2009

    As informações sobre os docentes, provenientes do DATACAPES, referem-se aos anos imediatamente anteriores aos respectivos Censos, com exceção do Censo de 2008, onde os dados dos docentes são relativos ao próprio ano de 2008.