Visão geral
O Modo de bloqueio é uma definição opcional de segurança avançada que restringe muitas ferramentas e capacidades dos produtos OpenAI, impedindo-as de aceder à rede. Oferece uma proteção determinística forte contra ataques de exfiltração de dados baseados em injeção de prompt, à custa de desativar ou limitar muitas funcionalidades que, de outra forma, seriam úteis.
O Modo de bloqueio não se destina a toda a gente, mas foi concebido para que as organizações protejam os dados sensíveis de membros que operam com o mais elevado risco de ataques de exfiltração de dados baseados em injeção de prompt.
Disponibilidade
O Modo de bloqueio está disponível para ChatGPT Enterprise, Edu, ChatGPT for Healthcare e ChatGPT for Teachers.
Planeamos disponibilizar o Modo de bloqueio para os planos de consumidor e de equipa do ChatGPT nos próximos meses.
Como protege o Modo de bloqueio contra ataques de exfiltração baseados em injeção de prompt?
A injeção de prompt é um problema de investigação avançado e desafiante, e estamos continuamente a trabalhar para reforçar os nossos sistemas de segurança e proteção multicamada para proteger todos os utilizadores contra este tipo de ataques.
Para as pessoas mais expostas a este tipo de ataques, o Modo de bloqueio oferece proteções de segurança determinísticas ao desativar muitas ferramentas e capacidades dos produtos OpenAI com acesso à rede.
O Modo de bloqueio baseia-se nas nossas proteções existentes aos níveis do modelo, do produto e do sistema. Isto inclui sandboxing, proteções contra exfiltração de dados baseada em URL, monitorização e aplicação, e controlos empresariais como acesso baseado em funções e registos de auditoria.
Especificamente, para quem está no Modo de bloqueio, as seguintes capacidades dos produtos OpenAI são desativadas:
Navegação web com acesso à web em direto: a navegação web fica limitada ao acesso apenas a conteúdo em cache. Isto significa que esta capacidade não pode ser usada para transmitir dados sensíveis a um atacante, embora também signifique que os resultados da pesquisa podem ser algo limitados ou desatualizados.
Suporte de imagem: as respostas do ChatGPT não podem incluir imagens. Os utilizadores continuam a poder carregar os seus próprios ficheiros de imagem e a usar a capacidade de geração de imagens.
Pesquisa aprofundada: a pesquisa aprofundada é desativada.
Modo de agente: o Modo de agente é desativado.
Rede do Canvas: os utilizadores não podem aprovar código gerado pelo Canvas para aceder à rede.
Transferências de ficheiros: o ChatGPT não pode transferir ficheiros para análise de dados. Tenha em atenção que o ChatGPT pode continuar a trabalhar com os ficheiros que carregar manualmente.
A configuração destas funcionalidades desta forma foi concebida para impedir que sejam usadas na fase final de ataques de exfiltração de dados orientados por injeção de prompt, ao impedir de forma determinística pedidos de rede de saída que poderiam ser enviados ao atacante para transferir esses dados. Tenha em atenção que o Modo de bloqueio não impede de forma determinística que as injeções de prompt cheguem ao contexto em primeiro lugar (por exemplo, uma injeção de prompt pode estar em conteúdo em cache acedido através da navegação web); em vez disso, foi concebido para impedir pedidos de rede que possam ser usados para transferir dados sensíveis para um atacante.
Tenha em atenção que o Modo de bloqueio não afeta a memória, os carregamentos de ficheiros nem a capacidade de partilhar a conversa. Muitas destas opções podem ser configuradas de forma independente pelos administradores do espaço de trabalho.
Tenha em atenção que o Modo de bloqueio não afeta o acesso à rede no Codex.
Como funciona o Modo de bloqueio com aplicações?
As aplicações (incluindo MCPs e conectores) podem interagir com a Internet, pelo que apresentam um risco potencial de serem usadas por atacantes para ataques de exfiltração de dados orientados por injeção de prompt, apesar das nossas várias proteções de segurança e proteção em múltiplas camadas.
Como muitos fluxos de trabalho importantes dependem de aplicações específicas de confiança, o Modo de bloqueio não desativa aplicações; em vez disso, recomendamos que os administradores da organização configurem cuidadosamente quais as aplicações, e quais as ações dentro delas, que ficam ativadas, limitando-as ao conjunto mínimo necessário.
Ao configurar aplicações para membros com o Modo de bloqueio ativado, recomendamos que os administradores considerem o seguinte guia, que descreve o risco de exfiltração de dados de cada uma:
Risco médio – usar com cautela para utilizadores no Modo de bloqueio:
Conectores de sincronização: os conectores de sincronização apresentam baixo risco como possível “destino” para ataques de exfiltração de dados, uma vez que os dados acedidos são sincronizados com a OpenAI, pelo que as consultas não resultam em pedidos de rede que saiam da rede da OpenAI. Ainda assim, podem atuar como fontes de dados sensíveis que agentes maliciosos podem tentar exfiltrar de lá.
Ações de leitura de aplicações de confiança: as ações de leitura em aplicações de confiança apresentam baixo risco como possível “destino” para ataques de exfiltração de dados. Ainda assim, podem atuar como fontes de dados sensíveis que agentes maliciosos podem tentar exfiltrar.
Ações de escrita de aplicações de confiança, quando a ação de escrita é garantidamente acessível apenas a pessoas da sua confiança: as ações de escrita são inerentemente mais arriscadas do que as ações de leitura, porque resultam num efeito secundário observável. Recomendamos vivamente que não ative quaisquer ações de escrita, a menos que tenha um elevado grau de confiança de que o efeito secundário não é observável por qualquer potencial agente malicioso.
Risco elevado – não recomendado para utilizadores no Modo de bloqueio:
Ações de leitura ou escrita em aplicações não confiáveis: recomendamos vivamente que não ative aplicações em que não confia
Ações de escrita de aplicações de confiança, quando não é garantido que a ação de escrita seja acessível apenas a pessoas da sua confiança: recomendamos vivamente que não ative ações de escrita, mesmo em aplicações em que confia, se não tiver total confiança de que o efeito secundário dessa ação de escrita não é, de forma alguma, observável por qualquer potencial agente malicioso.
Além disso, e separadamente do Modo de bloqueio, a **Compliance API Logs Platform** oferece visibilidade detalhada sobre a utilização de aplicações, os dados partilhados e as origens ligadas para ajudar os administradores a manter a supervisão à medida que as capacidades de IA se expandem.
Ativar o Modo de bloqueio para os membros do seu espaço de trabalho
Os administradores do espaço de trabalho podem criar uma nova função personalizada e designá-la como função de “Modo de bloqueio” e, em seguida, atribuir um grupo de utilizadores a essa função personalizada.
Perguntas frequentes
Quem pode ativar o Modo de bloqueio?
Os administradores do espaço de trabalho podem ativá-lo nas Definições do espaço de trabalho através de controlos de acesso baseados em funções.
O Modo de bloqueio impede todos os ataques de injeção de prompt?
O Modo de bloqueio foi concebido para reduzir substancialmente o risco de exfiltração de dados baseada em injeção de prompt no ChatGPT e no Atlas, mas não garante que isso não possa acontecer, por exemplo através de Aplicações ativadas ou de combinações imprevistas e recém-descobertas de outras capacidades. Além disso, o Modo de bloqueio não afeta os nossos produtos Codex.
Além disso, o Modo de bloqueio não impede todos os outros efeitos dos ataques de injeção de prompt; por exemplo, um ataque malicioso oculto num ficheiro carregado pode ainda afetar o comportamento do ChatGPT, por exemplo fazendo com que o ChatGPT responda incorretamente à sua pergunta.
O Modo de bloqueio está disponível no Plus, Pro, Free ou Teams?
Ainda não. Está disponível para Enterprise, Edu, Healthcare e Teachers. Planeamos alargar a disponibilidade nos próximos meses.
O Modo de bloqueio altera o que é registado na Compliance API Logs Platform?
A Compliance API Logs Platform oferece visibilidade detalhada sobre a utilização de aplicações, os dados partilhados e as origens ligadas. Esses registos não são afetados pelo Modo de bloqueio.
