quarta-feira, 4 de março de 2020

Como aumentar o uso de IA quando não há dados de treinamento o suficiente?

Por James Kobielus, InfoWorld em 03/03/2020 no site CIO

Foto: Shutterstock


A Inteligência Artificial (IA) é o campo de sonhos mais perfeito da cultura moderna. Se você perguntar à pessoa comum na rua onde a IA é executada, ela provavelmente não mencionará no que se convenciona como dados de treinamento ou, no inglês, training data. Em vez disso, podem murmurar algo sobre programas de computador que aprendem magicamente como fazer coisas úteis do nada. No entanto, algumas das inteligências artificiais mais sofisticadas de hoje se aproximam desse sonho ingênuo. Refiro-me a uma abordagem ainda em desenvolvimento, conhecida como "zero-shot learning” (aprendizado do zero).
Essa metodologia - que está sendo explorada na Microsoft, Uber, Baidu, Alibaba e outras empresas orientadas por IA - permite o reconhecimento de padrões com pouco ou nenhum dado de treinamento. O aprendizado de padrões zero-shot learning permitirá que os robôs inteligentes reconheçam e respondam dinamicamente a objetos, comportamentos e padrões ambientais desconhecidos que eles talvez nunca tenham encontrado no treinamento.
Prevejo que essas abordagens serão cada vez mais combinadas com o aprendizado por reforço, a fim de permitir que os robôs executem as melhores ações interativamente em ambientes caóticos e pontuais. Além disso, os aplicativos de jogos usarão abordagens zero-shot learning, como jogo interativo, como uma alternativa ao treinamento em dados volumosos derivados de uma jogabilidade bem-sucedida. Isso permitirá que o treinamento dos agentes domine estratégias complexas de ganho, apesar de não saber nada sobre esses jogos inicialmente.
Além disso, o zero-shot learning promete tornar os aplicativos de reconhecimento de objetos mais versáteis, devido à sua capacidade de conduzir:
  • Reconhecimento imediato de objetos raros, desconhecidos e invisíveis que podem estar substancialmente ausentes nos dados de treinamento;
  • Reconhecimento de padrões para os quais é difícil obter dados de treinamento rotulados com um nível suficientemente alto de conhecimento especializado;
  • Detecção de instâncias de classes de objetos em que a proliferação de categorias refinadas tornou difícil ou absurdamente caro para se adquirir quantidades suficientes de dados de treinamento rotulados estatisticamente diversos.

O que torna possível o zero-shot learning é a existência de conhecimento prévio que pode ser descoberto e reaproveitado por meio de abordagens estatísticas ou semânticas. Os métodos de zero-shot usam esse conhecimento para prever o maior espaço semântico de recursos que abrange as instâncias vistas (aquelas nos dados de treinamento) e as instâncias invisíveis (aquelas ausentes nos dados de treinamento).
Em relação à descoberta automatizada de conhecimento, algumas das abordagens técnicas mais promissoras para o zero-shot learning incluem:
  • Construção de modelos de classificação a partir de conhecimentos estatísticos adquiridos em projetos de aprendizado supervisionado anteriores que estão em domínios distintos, mas semanticamente adjacentes de reconhecimento de objetos (identificando uma classe nunca vista com base em características extraídas de uma espécie relacionada).
  • Extrair o conhecimento semântico dos objetos-alvo a partir de descrições textuais das classes-alvo (artigos da Web rastreados que descrevem os recursos visuais das espécies a serem reconhecidas).
  • O uso de vetores de palavras e outras abordagens gráficas para refinar inferências dos recursos semânticos das classes de destino daquelas das classes de origem, dada a disponibilidade de descrições textuais das classes de destino.
O aprendizado de zero-shot learning não pode realizar seu potencial como um acelerador de pipeline de IA, a menos que os cientistas de dados adquiram ferramentas que fornecem acesso simplificado a essas técnicas. Isso, por sua vez, exige kits de ferramentas de aprendizado profundo que suportam o design visual fácil de novos modelos a partir de blocos funcionais preexistentes sob um paradigma maior conhecido como "transfer learning” (aprendizado de transferência). Isso depende de bancadas de trabalho que fornecem aos cientistas de dados representações de recursos reutilizáveis, camadas de nós neurais, pesos, métodos de treinamento, taxas de aprendizado e outros recursos relevantes de modelos anteriores que podem ser rapidamente incorporados em projetos de IA de zero-shot.
À medida que as técnicas do zero-shot ganham aceitação e o conjunto de conhecimentos anteriores aumenta, os desenvolvedores de IA de alta qualidade ficam menos dependentes dos dados de treinamento.
Durante os próximos anos, veremos os cientistas de dados construindo aplicativos mais inteligentes de robótica, jogos e reconhecimento de padrões, configurando conhecimentos estatísticos e semânticos preexistentes, sem precisar adquirir, preparar e rotular grandes quantidades de novos dados de treinamento.
Quando esse dia chegar, mais aplicativos baseados em IA poderão automatizar o bootstrapping de sua inteligência, de um estado de pura ignorância para um profundo conhecimento por meio de técnicas ad-hoc, zero-shot e ocasionalmente adaptáveis. Isso marcará o verdadeiro começo da inteligência geral artificial, um sonho que motivou a comunidade de IA desde os dias de Alan Turing até o presente.

O que fazem e quanto ganham os profissionais mais demandados da Era dos Dados?

Por César Filho em 03/03/2020 no site CIO.

Foto: Shutterstock

Dados são o novo petróleo! Esta frase, cada vez mais comum, demonstra o valor dos dados para todos os mercados. Estamos na era do Conhecimento, a era do Saber. Mas a realidade é que dados, a exemplo do petróleo, em si, em sua essência, não servem para nada!
Para que um dado tenha valor de mercado, ele precisa ser captado, processado, refinado. E, por conta disso, os profissionais desta área são os mais demandados no presente.
Através do tratamento de dados, é possível entender um hábito, um costume, uma característica individual que podem ser comparados e associados às características de outro grupo de pessoas. Assim, é criada o que se chama de persona, uma espécie de estereótipo que contribui para a tomada de decisão das empresas, desde onde investir em propaganda, até mesmo saber como diferenciar seu atendimento, serviço ou produto para dar mais satisfação ao cliente.
Neste cenário, a pessoa que se transforma em especialista na extração dessas informações da grande massa de dados que as empresas processam se tornou uma peça fundamental na engrenagem de qualquer estratégia de inovação e crescimento.
Embora haja diferenciação de nomenclatura, esses profissionais atualmente estão distribuídos nas seguintes camadas hierárquicas:

Cientista de Dados

É um dos profissionais mais demandados, com altos valores de remuneração, mas que traz uma exigência muito grande de conhecimento de programação, de inteligência artificial e de arquiteturas de sistemas de dados. Esta carreira é para poucos e com poucas, mas bem remuneradas vagas - salários que podem chegar a R$ 35 mil.

Analistas de dados

Já os Analistas de Dados ou Gestores de Dados são os especialistas que se valem da fonte de dados que é criada pelos cientistas. Há uma grande oferta de vagas, bem remuneradas, pois agregam valor direto ao segmento produtivo da empresa. Salários que variam entre R$5 mil e R$20 mil, de acordo com o segmento.

Designers de Dashboards

Os Designers de Dashboards (painéis de dados) são profissionais bastante importantes porque expressam em painéis sinóticos os valores, as grandezas dos indicadores (informações tidas como chaves) para auxiliar os momentos de tomadas de decisão. Os indicadores hoje não são expressos em tabelas e sim em gráficos que mudam de cor, alteram suas formas para indicar a proximidade de pontos “críticos” positivos ou negativos para a operação da empresa, do departamento, como os reservatórios de combustível indicando limites baixos ou altos. Salários no mercado podem variar de R$7 mil  R$15 mil.

Designer de coletas de dados

Os criadores de consultas ou de pesquisas são os Designers de Coletas de Dados. Eles são importantes por criar pesquisas, formulários que sejam eficientes no seu objetivo sem desgastar o usuário do instrumento. Salários podem variar de R$4 mil a R$12 mil.
A satisfação do cliente, a sua fidelização, os diferenciais de atração são elementos fundamentais nesta realidade do saber, do conhecer e se aproximar. É importante que os profissionais percebam essa nova realidade de mercado, onde dados transformados em informações são insumos essenciais para qualquer segmento e estar preparado para utilizar estas informações é o que é identificado como inteligência de negócios.

*César Silva é diretor Presidente da Fundação de Apoio à Tecnologia (FAT) e docente da Faculdade de Tecnologia de São Paulo – FATEC-SP há mais de 30 anos. Foi vice-diretor superintendente do Centro Paula Souza. É formado em Administração de Empresas, com especialização em Gestão de Projetos, Processos Organizacionais e Sistemas de Informação.