Hooks de Chamada LLM

Os Hooks de Chamada LLM fornecem controle fino sobre interações com modelos de linguagem durante a execução do agente. Esses hooks permitem interceptar chamadas LLM, modificar prompts, transformar respostas, implementar gates de aprovação e adicionar logging ou monitoramento personalizado.

Visão Geral

Os hooks LLM são executados em dois pontos críticos:

Antes da Chamada LLM: Modificar mensagens, validar entradas ou bloquear execução
Depois da Chamada LLM: Transformar respostas, sanitizar saídas ou modificar histórico de conversação

Tipos de Hook

Hooks Antes da Chamada LLM

Executados antes de cada chamada LLM, esses hooks podem:

Inspecionar e modificar mensagens enviadas ao LLM
Bloquear execução LLM com base em condições
Implementar limitação de taxa ou gates de aprovação
Adicionar contexto ou mensagens do sistema
Registrar detalhes da requisição

Assinatura:

def before_hook(context: LLMCallHookContext) -> bool | None:
    # Retorne False para bloquear execução
    # Retorne True ou None para permitir execução
    ...

Hooks Depois da Chamada LLM

Executados depois de cada chamada LLM, esses hooks podem:

Modificar ou sanitizar respostas do LLM
Adicionar metadados ou formatação
Registrar detalhes da resposta
Atualizar histórico de conversação
Implementar filtragem de conteúdo

Assinatura:

def after_hook(context: LLMCallHookContext) -> str | None:
    # Retorne string de resposta modificada
    # Retorne None para manter resposta original
    ...

Contexto do Hook LLM

O objeto LLMCallHookContext fornece acesso abrangente ao estado de execução:

class LLMCallHookContext:
    executor: CrewAgentExecutor  # Referência completa ao executor
    messages: list               # Lista de mensagens mutável
    agent: Agent                 # Agente atual
    task: Task                   # Tarefa atual
    crew: Crew                   # Instância da crew
    llm: BaseLLM                 # Instância do LLM
    iterations: int              # Contagem de iteração atual
    response: str | None         # Resposta do LLM (apenas hooks posteriores)

Modificando Mensagens

Importante: Sempre modifique mensagens in-place:

# ✅ Correto - modificar in-place
def add_context(context: LLMCallHookContext) -> None:
    context.messages.append({"role": "system", "content": "Seja conciso"})

# ❌ Errado - substitui referência da lista
def wrong_approach(context: LLMCallHookContext) -> None:
    context.messages = [{"role": "system", "content": "Seja conciso"}]

Métodos de Registro

1. Registro Baseado em Decoradores (Recomendado)

Use decoradores para sintaxe mais limpa:

from crewai.hooks import before_llm_call, after_llm_call

@before_llm_call
def validate_iteration_count(context):
    """Valida a contagem de iterações."""
    if context.iterations > 10:
        print("⚠️ Máximo de iterações excedido")
        return False  # Bloquear execução
    return None

@after_llm_call
def sanitize_response(context):
    """Remove dados sensíveis."""
    if context.response and "API_KEY" in context.response:
        return context.response.replace("API_KEY", "[CENSURADO]")
    return None

2. Hooks com Escopo de Crew

Registre hooks para uma instância específica de crew:

from crewai import CrewBase
from crewai.project import crew
from crewai.hooks import before_llm_call_crew, after_llm_call_crew

@CrewBase
class MyProjCrew:
    @before_llm_call_crew
    def validate_inputs(self, context):
        # Aplica-se apenas a esta crew
        if context.iterations == 0:
            print(f"Iniciando tarefa: {context.task.description}")
        return None
    
    @after_llm_call_crew
    def log_responses(self, context):
        # Logging específico da crew
        print(f"Comprimento da resposta: {len(context.response)}")
        return None
    
    @crew
    def crew(self) -> Crew:
        return Crew(
            agents=self.agents,
            tasks=self.tasks,
            process=Process.sequential,
            verbose=True
        )

Casos de Uso Comuns

1. Limitação de Iterações

@before_llm_call
def limit_iterations(context: LLMCallHookContext) -> bool | None:
    """Previne loops infinitos limitando iterações."""
    max_iterations = 15
    if context.iterations > max_iterations:
        print(f"⛔ Bloqueado: Excedeu {max_iterations} iterações")
        return False  # Bloquear execução
    return None

2. Gate de Aprovação Humana

@before_llm_call
def require_approval(context: LLMCallHookContext) -> bool | None:
    """Requer aprovação após certas iterações."""
    if context.iterations > 5:
        response = context.request_human_input(
            prompt=f"Iteração {context.iterations}: Aprovar chamada LLM?",
            default_message="Pressione Enter para aprovar, ou digite 'não' para bloquear:"
        )
        if response.lower() == "não":
            print("🚫 Chamada LLM bloqueada pelo usuário")
            return False
    return None

3. Adicionando Contexto do Sistema

@before_llm_call
def add_guardrails(context: LLMCallHookContext) -> None:
    """Adiciona diretrizes de segurança a cada chamada LLM."""
    context.messages.append({
        "role": "system",
        "content": "Garanta que as respostas sejam factuais e cite fontes quando possível."
    })
    return None

4. Sanitização de Resposta

@after_llm_call
def sanitize_sensitive_data(context: LLMCallHookContext) -> str | None:
    """Remove padrões sensíveis."""
    if not context.response:
        return None
    
    import re
    sanitized = context.response
    sanitized = re.sub(r'\b\d{3}\.\d{3}\.\d{3}-\d{2}\b', '[CPF-CENSURADO]', sanitized)
    sanitized = re.sub(r'\b\d{4}[- ]?\d{4}[- ]?\d{4}[- ]?\d{4}\b', '[CARTÃO-CENSURADO]', sanitized)
    
    return sanitized

5. Rastreamento de Custos

import tiktoken

@before_llm_call
def track_token_usage(context: LLMCallHookContext) -> None:
    """Rastreia tokens de entrada."""
    encoding = tiktoken.get_encoding("cl100k_base")
    total_tokens = sum(
        len(encoding.encode(msg.get("content", ""))) 
        for msg in context.messages
    )
    print(f"📊 Tokens de entrada: ~{total_tokens}")
    return None

@after_llm_call
def track_response_tokens(context: LLMCallHookContext) -> None:
    """Rastreia tokens de resposta."""
    if context.response:
        encoding = tiktoken.get_encoding("cl100k_base")
        tokens = len(encoding.encode(context.response))
        print(f"📊 Tokens de resposta: ~{tokens}")
    return None

6. Logging de Debug

@before_llm_call
def debug_request(context: LLMCallHookContext) -> None:
    """Debug de requisição LLM."""
    print(f"""
    🔍 Debug de Chamada LLM:
    - Agente: {context.agent.role}
    - Tarefa: {context.task.description[:50]}...
    - Iteração: {context.iterations}
    - Contagem de Mensagens: {len(context.messages)}
    - Última Mensagem: {context.messages[-1] if context.messages else 'Nenhuma'}
    """)
    return None

@after_llm_call
def debug_response(context: LLMCallHookContext) -> None:
    """Debug de resposta LLM."""
    if context.response:
        print(f"✅ Preview da Resposta: {context.response[:100]}...")
    return None

Gerenciamento de Hooks

Desregistrando Hooks

from crewai.hooks import (
    unregister_before_llm_call_hook,
    unregister_after_llm_call_hook
)

# Desregistrar hook específico
def my_hook(context):
    ...

register_before_llm_call_hook(my_hook)
# Mais tarde...
unregister_before_llm_call_hook(my_hook)  # Retorna True se encontrado

Limpando Hooks

from crewai.hooks import (
    clear_before_llm_call_hooks,
    clear_after_llm_call_hooks,
    clear_all_llm_call_hooks
)

# Limpar tipo específico de hook
count = clear_before_llm_call_hooks()
print(f"Limpou {count} hooks antes")

# Limpar todos os hooks LLM
before_count, after_count = clear_all_llm_call_hooks()
print(f"Limpou {before_count} hooks antes e {after_count} hooks depois")

Padrões Avançados

Execução Condicional de Hook

@before_llm_call
def conditional_blocking(context: LLMCallHookContext) -> bool | None:
    """Bloqueia apenas em condições específicas."""
    # Bloquear apenas para agentes específicos
    if context.agent.role == "researcher" and context.iterations > 10:
        return False
    
    # Bloquear apenas para tarefas específicas
    if "sensível" in context.task.description.lower() and context.iterations > 5:
        return False
    
    return None

Modificações com Consciência de Contexto

@before_llm_call
def adaptive_prompting(context: LLMCallHookContext) -> None:
    """Adiciona contexto diferente baseado na iteração."""
    if context.iterations == 0:
        context.messages.append({
            "role": "system",
            "content": "Comece com uma visão geral de alto nível."
        })
    elif context.iterations > 3:
        context.messages.append({
            "role": "system",
            "content": "Foque em detalhes específicos e forneça exemplos."
        })
    return None

Melhores Práticas

Mantenha Hooks Focados: Cada hook deve ter uma responsabilidade única
Evite Computação Pesada: Hooks executam em cada chamada LLM
Trate Erros Graciosamente: Use try-except para prevenir falhas de hooks
Use Type Hints: Aproveite LLMCallHookContext para melhor suporte IDE
Documente Comportamento do Hook: Especialmente para condições de bloqueio
Teste Hooks Independentemente: Teste unitário de hooks antes de usar em produção
Limpe Hooks em Testes: Use clear_all_llm_call_hooks() entre execuções de teste
Modifique In-Place: Sempre modifique context.messages in-place, nunca substitua

Tratamento de Erros

@before_llm_call
def safe_hook(context: LLMCallHookContext) -> bool | None:
    try:
        # Sua lógica de hook
        if some_condition:
            return False
    except Exception as e:
        print(f"⚠️ Erro no hook: {e}")
        # Decida: permitir ou bloquear em erro
        return None  # Permitir execução apesar do erro

Segurança de Tipos

from crewai.hooks import LLMCallHookContext, BeforeLLMCallHookType, AfterLLMCallHookType

# Anotações de tipo explícitas
def my_before_hook(context: LLMCallHookContext) -> bool | None:
    return None

def my_after_hook(context: LLMCallHookContext) -> str | None:
    return None

# Registro type-safe
register_before_llm_call_hook(my_before_hook)
register_after_llm_call_hook(my_after_hook)

Solução de Problemas

Hook Não Está Executando

Verifique se o hook está registrado antes da execução da crew
Verifique se hook anterior retornou False (bloqueia hooks subsequentes)
Garanta que assinatura do hook corresponda ao tipo esperado

Modificações de Mensagem Não Persistem

Use modificações in-place: context.messages.append()
Não substitua a lista: context.messages = []

Modificações de Resposta Não Funcionam

Retorne a string modificada dos hooks posteriores
Retornar None mantém a resposta original

Conclusão

Os Hooks de Chamada LLM fornecem capacidades poderosas para controlar e monitorar interações com modelos de linguagem no CrewAI. Use-os para implementar guardrails de segurança, gates de aprovação, logging, rastreamento de custos e sanitização de respostas. Combinados com tratamento adequado de erros e segurança de tipos, os hooks permitem sistemas de agentes robustos e prontos para produção.

Começando

Guias

Conceitos-Chave

Integração MCP

Ferramentas

Observabilidade

Aprenda

Telemetria

Hooks de Chamada LLM

Visão Geral

Tipos de Hook

Hooks Antes da Chamada LLM

Hooks Depois da Chamada LLM

Contexto do Hook LLM

Modificando Mensagens

Métodos de Registro

1. Registro Baseado em Decoradores (Recomendado)

2. Hooks com Escopo de Crew

Casos de Uso Comuns

1. Limitação de Iterações

2. Gate de Aprovação Humana

3. Adicionando Contexto do Sistema

4. Sanitização de Resposta

5. Rastreamento de Custos

6. Logging de Debug

Gerenciamento de Hooks

Desregistrando Hooks

Limpando Hooks

Padrões Avançados

Execução Condicional de Hook

Modificações com Consciência de Contexto

Melhores Práticas

Tratamento de Erros

Segurança de Tipos

Solução de Problemas

Hook Não Está Executando

Modificações de Mensagem Não Persistem

Modificações de Resposta Não Funcionam

Conclusão

Começando

Guias

Conceitos-Chave

Integração MCP

Ferramentas

Observabilidade

Aprenda

Telemetria

Documentation Index

​Visão Geral

​Tipos de Hook

​Hooks Antes da Chamada LLM

​Hooks Depois da Chamada LLM

​Contexto do Hook LLM

​Modificando Mensagens

​Métodos de Registro

​1. Registro Baseado em Decoradores (Recomendado)

​2. Hooks com Escopo de Crew

​Casos de Uso Comuns

​1. Limitação de Iterações

​2. Gate de Aprovação Humana

​3. Adicionando Contexto do Sistema

​4. Sanitização de Resposta

​5. Rastreamento de Custos

​6. Logging de Debug

​Gerenciamento de Hooks

​Desregistrando Hooks

​Limpando Hooks

​Padrões Avançados

​Execução Condicional de Hook

​Modificações com Consciência de Contexto

​Melhores Práticas

​Tratamento de Erros

​Segurança de Tipos

​Solução de Problemas

​Hook Não Está Executando

​Modificações de Mensagem Não Persistem

​Modificações de Resposta Não Funcionam

​Conclusão

Visão Geral

Tipos de Hook

Hooks Antes da Chamada LLM

Hooks Depois da Chamada LLM

Contexto do Hook LLM

Modificando Mensagens

Métodos de Registro

1. Registro Baseado em Decoradores (Recomendado)

2. Hooks com Escopo de Crew

Casos de Uso Comuns

1. Limitação de Iterações

2. Gate de Aprovação Humana

3. Adicionando Contexto do Sistema

4. Sanitização de Resposta

5. Rastreamento de Custos

6. Logging de Debug

Gerenciamento de Hooks

Desregistrando Hooks

Limpando Hooks

Padrões Avançados

Execução Condicional de Hook

Modificações com Consciência de Contexto

Melhores Práticas

Tratamento de Erros

Segurança de Tipos

Solução de Problemas

Hook Não Está Executando

Modificações de Mensagem Não Persistem

Modificações de Resposta Não Funcionam

Conclusão