LiteLLM - What is Netra? | Technical documentation

Installation

Install both the Netra SDK and LiteLLM:

pip install netra-sdk litellm

Usage

Initialize the Netra SDK to automatically trace all LiteLLM operations:

from netra import Netra
from litellm import completion
import os

# Initialize Netra
Netra.init(
    headers=f"x-api-key={os.environ.get('NETRA_API_KEY')}",
    trace_content=True
)

# Use LiteLLM as normal - automatically traced
response = completion(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

LiteLLM Features

Trace completions across different providers:

from netra.decorators import task
from netra import SpanWrapper
from litellm import completion

@task()
def call_multiple_providers(prompt: str) -> dict:
    span = SpanWrapper("multi-provider", {
        "prompt": prompt
    }).start()
    
    results = {}
    
    # OpenAI
    openai_response = completion(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}]
    )
    results["openai"] = openai_response.choices[0].message.content
    
    # Anthropic
    anthropic_response = completion(
        model="claude-3-sonnet-20240229",
        messages=[{"role": "user", "content": prompt}]
    )
    results["anthropic"] = anthropic_response.choices[0].message.content
    
    span.set_attribute("providers.count", len(results))
    span.end()
    
    return results

Lightweight Design

Trace with minimal overhead:

from netra.decorators import workflow
from netra import SpanWrapper
from litellm import completion

@workflow()
def efficient_completion(messages: list[dict], model: str = "gpt-3.5-turbo"):
    span = SpanWrapper("litellm-completion", {
        "model": model,
        "messages.count": len(messages)
    }).start()
    
    response = completion(
        model=model,
        messages=messages,
        timeout=30
    )
    
    content = response.choices[0].message.content
    span.set_attribute("response", content)
    span.set_attribute("tokens.total", response.usage.total_tokens)
    span.end()
    
    return content

Modular Architecture

Trace with custom configurations:

from netra.decorators import agent
from netra import SpanWrapper
from litellm import completion

@agent()
def completion_with_fallback(prompt: str, models: list[str]):
    span = SpanWrapper("fallback-completion", {
        "prompt": prompt,
        "models": ",".join(models)
    }).start()
    
    for model in models:
        try:
            response = completion(
                model=model,
                messages=[{"role": "user", "content": prompt}],
                timeout=10
            )
            
            span.set_attribute("successful_model", model)
            span.end()
            
            return response.choices[0].message.content
        except Exception as e:
            span.set_attribute(f"error.{model}", str(e))
            continue
    
    span.set_status(code=1, message="All models failed")
    span.end()
    raise Exception("All models failed")

Cross-Platform Support

Trace streaming across platforms:

from netra.decorators import task
from netra import SpanWrapper
from litellm import completion

@task()
def stream_any_provider(model: str, prompt: str):
    stream_span = SpanWrapper("litellm-stream", {
        "model": model
    }).start()
    
    response = completion(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        stream=True
    )
    
    full_response = ""
    for chunk in response:
        if chunk.choices[0].delta.content:
            content = chunk.choices[0].delta.content
            print(content, end='', flush=True)
            full_response += content
    
    stream_span.set_attribute("response", full_response)
    stream_span.end()
    
    return full_response

Async Support

Trace async completions:

from netra.decorators import task
from netra import SpanWrapper
from litellm import acompletion
import asyncio

@task()
async def async_completion(prompt: str):
    span = SpanWrapper("async-completion").start()
    
    response = await acompletion(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}]
    )
    
    content = response.choices[0].message.content
    span.set_attribute("response", content)
    span.end()
    
    return content

Configuration

Configure LiteLLM instrumentation:

from netra import Netra
from netra.instrumentation.instruments import InstrumentSet

Netra.init(
    headers=f"x-api-key={os.environ.get('NETRA_API_KEY')}",
    trace_content=True,
    instruments={InstrumentSet.LITELLM}
)

Next Steps

Quick Start Guide - Complete setup and configuration
Decorators - Add custom tracing with @workflow, @agent, and @task decorators
LiteLLM Documentation - Official LiteLLM documentation

​Installation

​Usage

​LiteLLM Features

​Lightweight Design

​Modular Architecture

​Cross-Platform Support

​Async Support

​Configuration

​Next Steps