上下文记忆管理

Java突击队2026/4/30大约 2 分钟

第八章：对话记忆与上下文控制：别让历史无限膨胀

8.1 记忆不是“越多越好”

历史对话越多，常见副作用越明显：

成本上升：token 越来越多
稳定性下降：模型更容易被历史细节带偏
延迟变差：请求更大更慢

所以你的目标不是“记住所有”，而是“记住足够的、对当前任务有用的”。

8.2 最常用策略：窗口记忆（MessageWindowChatMemory）

窗口记忆保留最近 N 条消息，简单可靠，适合绝大多数对话产品的第一版上线。

package com.example.langchain4j.memory;

import dev.langchain4j.memory.chat.MessageWindowChatMemory;
import dev.langchain4j.model.openai.OpenAiChatModel;
import dev.langchain4j.service.AiServices;

public class MemoryExample {

    interface Assistant {
        String chat(String message);
    }

    public static void main(String[] args) {
        String apiKey = System.getenv("OPENAI_API_KEY");
        if (apiKey == null || apiKey.isBlank()) {
            throw new IllegalStateException("请先设置环境变量 OPENAI_API_KEY");
        }

        var model = OpenAiChatModel.builder()
                .apiKey(apiKey)
                .modelName("gpt-4o-mini")
                .temperature(0.2)
                .build();

        var memory = MessageWindowChatMemory.withMaxMessages(10);

        Assistant assistant = AiServices.builder(Assistant.class)
                .chatLanguageModel(model)
                .chatMemory(memory)
                .build();

        System.out.println(assistant.chat("我叫小李，做后端开发。"));
        System.out.println(assistant.chat("请用一句话总结一下我是谁。"));
    }
}