Zum Inhalt

Context Window

Das Context Window optimal nutzen und verstehen.

Konzept

Das Context Window ist der "Arbeitsspeicher" von Claude:

┌─────────────────────────────────────────────┐
│              CONTEXT WINDOW                 │
│              (200K Tokens)                  │
├─────────────────────────────────────────────┤
│  System Prompt        │  ~2K Tokens        │
│  CLAUDE.md            │  ~1K Tokens        │
│  Active Skills        │  ~2K Tokens        │
│  Tool Definitions     │  ~3K Tokens        │
├─────────────────────────────────────────────┤
│  Conversation History │  Wächst...         │
│  - User messages                            │
│  - Claude responses                         │
│  - Tool outputs                             │
│  - File contents                            │
├─────────────────────────────────────────────┤
│  Current Turn         │  Variabel          │
│  - Aktuelle Frage                           │
│  - Geladene Dateien                         │
└─────────────────────────────────────────────┘

Window-Aufteilung

Feste Kosten (~8K Tokens)

Diese sind immer da:

  • System Prompt: ~2K
  • Tool Definitions: ~3K
  • CLAUDE.md: ~1K
  • Buffer: ~2K

Variable Kosten (Rest)

Was du in der Session machst:

  • Jede Message: 100-1000 Tokens
  • Jede Response: 500-4000 Tokens
  • Tool Output: Variiert stark
  • Geladene Dateien: ~250 Tokens/KB

Context-Anzeige

Im Terminal

Die Prompt-Box zeigt den Füllstand:

┌────────────────────────┐
│ > Enter your message   │
│ [████████░░░░] 65%     │
└────────────────────────┘

Via Command

/context

Zeigt: - Total Tokens - Tokens by category - Remaining capacity

Context-Optimierung

1. Dateien gezielt laden

# Schlecht - lädt alles
Read the src/ directory

# Gut - nur was nötig ist
Read src/auth/login.ts and src/auth/jwt.ts

2. Tool-Output minimieren

Bei großen Outputs:

# Schlecht
Run grep -r "TODO" .

# Besser
Run grep -r "TODO" src/ --include="*.ts" | head -20

3. @ für schnelles Laden

Statt:

Read package.json and analyze dependencies

Schneller:

@package.json - analyze these dependencies

@ lädt die Datei direkt in den Context.

4. Conversation History managen

Lange Sessions fragmentieren den Context. Optionen:

  1. /compact - Zusammenfassen
  2. Neue Session + /resume - Fortsetzen
  3. Explizit zusammenfassen:
    Before we continue, summarize the key points 
    of our discussion so far.
    

Context Window Limits

Symptome wenn voll

  • Langsamere Responses
  • Claude "vergisst" frühere Informationen
  • Fehler bei komplexen Tasks

Prävention

  1. Monitor - /usage regelmäßig checken
  2. Compact - Bei >70% compacten
  3. Cleanup - Nicht mehr benötigte Files droppen

Baseline-Dokument Pattern

Für große Projekte mit viel Kontext:

1. Baseline erstellen

cat > ~/.claude/baselines/my-project.md << 'EOF'
# Project Baseline

## State after Session 2025-01-15

### Completed Features
- Auth module (JWT)
- User CRUD
- Basic API

### Architecture
[Kurze Beschreibung]

### Open Tasks
- Profile feature
- Rate limiting

### Key Decisions
- Redis für Sessions
- PostgreSQL für Data
EOF

2. Baseline laden

Load baseline: @~/.claude/baselines/my-project.md

3. Nach Session updaten

Update the baseline document with our progress today

Multi-File Arbeit

Wenn du an vielen Dateien arbeitest:

Problem

Read these 20 files and refactor them
→ Context explodiert

Lösung

Refactor these files one at a time, 
unloading each after completion:
- src/a.ts
- src/b.ts
- ...

Oder mit Sub-Agents:

Spawn agents to handle each file independently,
using Haiku for each.