Política de privacidade da UJJI AI
Última atualização: 10 de setembro de 2024
Na UJJI, sempre abordamos as novas tecnologias com cautela. Desde o lançamento da nossa IA em 2020, desenvolvemos um processo robusto e uma equipe qualificada. No ano passado, os avanços nos grandes modelos de linguagem (LLMs) nos impressionaram, especialmente sua capacidade de resolver problemas do usuário, como sobrecarga de informações. Noventa por cento dos adotantes da IA relataram aumento na produtividade. O lançamento de produtos de IA exige o cumprimento dos rígidos padrões de administração de dados da UJJI. Nosso objetivo é criar uma IA confiável e eficaz. O setor de modelos generativos é jovem e focado em pesquisas, com poucos padrões de segurança e privacidade de nível corporativo a serem seguidos.
Criamos a UJJI AI a partir de princípios, com foco em manter nossos padrões de segurança, conformidade e privacidade. Esses princípios esclareceram nosso projeto de arquitetura, embora às vezes fosse desafiador. Explicaremos como esses princípios moldaram a UJJI AI hoje.
Dados do cliente
Nossa decisão mais importante foi garantir que pudéssemos usar um modelo de primeira linha e, ao mesmo tempo, manter os dados do cliente em VPCs controladas por Ujji. No setor de modelos generativos, a maioria dos clientes usava serviços hospedados diretamente, com poucas alternativas.
A UJJI e nossos clientes têm grandes expectativas em relação à propriedade dos dados.
Internamente, processamos esse conteúdo em nossos servidores. A única ação externa é enviar solicitações com contexto para a API GPT. Esse fluxo de trabalho começa com o upload de um arquivo. Embora enviemos dados externamente, não enviamos documentos inteiros. Em vez disso, armazenamos pequenos pedaços do conteúdo do documento e enviamos apenas partes essenciais. Mesmo que algo dê errado, nunca usamos todos os dados, apenas o contexto necessário.
Com base em nossas necessidades, recuperamos as partes mais relevantes do banco de dados e enviamos esse pequeno fragmento para o GPT. O GPT processa isso e fornece uma resposta.
Não treinamos grandes modelos linguísticos (LLMs) com base em dados de clientes
Usamos modelos prontos para uso em vez de treinar novos devido a questões de privacidade. Os modelos tradicionais de ML classificaram os resultados da pesquisa sem vazamentos de dados, ao contrário dos modelos generativos de IA treinados com dados de clientes da UJJI.
Escolhemos Retrieval Augmented Generation (RAG), que inclui todo o contexto em cada solicitação para garantir que o modelo não retenha dados. Por exemplo, resumir um canal envolve enviar um prompt com mensagens e instruções. A apatridia da RAG garante privacidade e baseia os resultados no conhecimento da sua empresa, não na Internet pública.
O RAG limita os modelos àqueles com grandes janelas de contexto, o que significa um processamento mais lento. Resumir todas as mensagens em um canal exige muitos dados, o que torna difícil encontrar um modelo de primeira linha com grandes janelas de contexto e baixa latência.
O RAG está se tornando mais rápido e eficiente com janelas de contexto maiores e melhor síntese de dados, garantindo resultados de qualidade e protegendo os dados do cliente. Não treinamos grandes modelos linguísticos (LLMs) com base em dados de clientes.
O UJJI AI opera apenas com dados que o usuário já pode ver
Um dos nossos princípios fundamentais é que o UJJI AI só acessa dados visíveis para o usuário solicitante. O recurso de pesquisa do UJJI AI, por exemplo, nunca mostrará resultados que a pesquisa padrão não mostraria. Os resumos nunca incluirão conteúdo que o usuário não poderia ver ao ler os canais.
Garantimos isso usando a Lista de Controle de Acesso (ACLs) do usuário solicitante ao buscar dados para resumir ou pesquisar e aproveitando nossas bibliotecas existentes para buscar os dados exibidos nos canais ou na página de resultados da pesquisa.
Isso não foi tecnicamente difícil, mas exigiu uma escolha deliberada; a melhor maneira de garantir isso era desenvolver e reutilizar os principais conjuntos de recursos do UJJI e, ao mesmo tempo, adicionar alguns aprimoramentos de IA no final.
Somente o usuário que invoca o UJJI AI pode ver a saída gerada pela IA. Isso aumenta a confiança de que a UJJI é seu parceiro confiável de IA: somente os dados que você pode ver entram e somente você pode ver a saída.
A UJJI AI cumpre todos os requisitos de segurança e conformidade de nível empresarial da UJJI
A UJJI AI integra todas as nossas ofertas de conformidade e segurança, armazenando somente os dados necessários pelo período necessário. Muitas vezes, nenhum dado é armazenado; saídas como resumos de conversas e respostas de pesquisa não são salvas em disco.
Quando o armazenamento de dados é necessário, usamos a infraestrutura de conformidade existente da UJJI e criamos um novo suporte quando necessário. Nossa infraestrutura inclui gerenciamento de chaves de criptografia e residência internacional de dados. Adicionamos suporte para garantir que o conteúdo derivado, como resumos, esteja ciente de suas mensagens de origem. Por exemplo, se uma mensagem for removida devido à Proteção contra perda de dados (DLP), os resumos relacionados serão invalidados. Isso garante que o DLP e outros controles sejam eficazes tanto no conteúdo da mensagem da UJJI quanto nas saídas de IA da UJJI.
Essa visão geral destaca nosso compromisso com a segurança e a privacidade, mostrando a seriedade com que protegemos os dados de nossos clientes.