大语言模型(LLM)应用开发最佳实践：从Prompt Engineering到RAG检索增强生成技术

引言

随着人工智能技术的快速发展，大语言模型(Large Language Models, LLMs)已经成为构建智能应用的核心技术之一。从聊天机器人到内容创作，从代码生成到知识问答，LLMs正在改变我们开发和交互的方式。然而，要充分发挥LLM的强大能力，开发者需要掌握一系列关键技术实践。

本文将深入探讨大语言模型应用开发的核心技术要点，涵盖Prompt工程优化、RAG检索增强生成、模型微调、推理优化等关键技术，为开发者提供一套完整的LLM应用开发最佳实践指南。

一、Prompt Engineering：构建高效LLM交互的关键

1.1 Prompt工程基础概念

Prompt Engineering（提示工程）是指导LLM产生期望输出的技术艺术。一个精心设计的Prompt能够显著提升模型的性能和准确性，而糟糕的Prompt可能导致错误或不相关的响应。

Prompt的核心要素包括：

指令明确性：清晰地告诉模型需要完成什么任务
上下文提供：为模型提供必要的背景信息
格式要求：指定输出的格式和结构
约束条件：定义输出的限制和边界

1.2 Prompt设计最佳实践

指令清晰化

# 不好的Prompt示例
"告诉我关于AI的信息"

# 好的Prompt示例
"请以学术论文的形式，详细阐述人工智能的发展历程、核心技术突破和未来发展趋势，字数不少于500字。"

提供上下文信息

def create_contextual_prompt(task, context, specific_question):
    """
    创建带有上下文的Prompt模板
    """
    prompt = f"""
    背景信息：{context}
    
    任务要求：{task}
    
    具体问题：{specific_question}
    
    请基于以上信息，提供详细的回答。
    """
    return prompt

# 使用示例
context = "某科技公司正在开发一款基于深度学习的图像识别系统"
task = "分析该系统的潜在应用场景"
question = "请列举三个主要的应用场景并说明其技术优势"

final_prompt = create_contextual_prompt(task, context, question)

温和指令与具体要求

def generate_effective_prompt():
    """
    生成高效Prompt的模板
    """
    template = """
    请以以下方式回答问题：
    
    1. 首先，仔细理解问题的核心要求
    2. 然后，基于已知信息进行分析
    3. 最后，提供清晰、有条理的回答
    
    问题：{question}
    
    回答格式要求：
    - 使用分点说明
    - 每个要点不超过30字
    - 用专业术语但保持易懂性
    """
    return template

# 应用示例
question = "请解释机器学习中的过拟合现象及其解决方案"
prompt_template = generate_effective_prompt()
final_prompt = prompt_template.format(question=question)

1.3 Prompt优化技术

Chain-of-Thought (CoT) 思维链

def create_chain_of_thought_prompt(problem, reasoning_steps):
    """
    创建思维链Prompt
    """
    cot_prompt = f"""
    请解决以下问题：{problem}
    
    请采用逐步推理的方式：
    {reasoning_steps}
    
    最终答案：
    """
    return cot_prompt

# 示例应用
problem = "计算一个边长为5cm的正方体的表面积"
reasoning_steps = """
1. 正方体有6个面
2. 每个面都是正方形
3. 正方形面积 = 边长 × 边长
4. 单个面面积 = 5cm × 5cm = 25cm²
5. 总表面积 = 6 × 25cm² = 150cm²
"""

cot_prompt = create_chain_of_thought_prompt(problem, reasoning_steps)

Zero-shot、Few-shot与In-context Learning

def create_few_shot_examples():
    """
    创建Few-shot学习示例
    """
    examples = [
        {"input": "今天天气怎么样？", "output": "根据最新天气预报，今天晴朗，气温在20-25度之间。"},
        {"input": "如何制作披萨？", "output": "1. 准备面团 2. 制作番茄酱 3. 添加奶酪和配料 4. 烘烤15分钟"},
        {"input": "解释量子计算原理", "output": "量子计算利用量子比特的叠加态和纠缠特性进行并行计算，相比传统计算机具有指数级加速潜力。"}
    ]
    
    prompt = "请参考以下示例回答问题：\n"
    for example in examples:
        prompt += f"问：{example['input']}\n答：{example['output']}\n\n"
    
    prompt += "现在请回答：{question}"
    return prompt

# 使用示例
few_shot_prompt = create_few_shot_examples()
final_question = "解释人工智能的发展历程"
complete_prompt = few_shot_prompt.format(question=final_question)

二、RAG检索增强生成技术详解

2.1 RAG核心技术原理

RAG（Retrieval-Augmented Generation）是将信息检索与生成模型相结合的技术架构。它通过在生成前从外部知识库中检索相关信息，然后利用这些检索到的信息来生成更准确、更相关的回答。

RAG的核心流程：

检索阶段：根据用户查询从知识库中检索相关文档
生成阶段：将检索结果作为上下文输入到生成模型中
融合输出：生成最终的回答

2.2 RAG系统架构实现

import numpy as np
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import faiss
from typing import List, Dict, Tuple

class RAGSystem:
    def __init__(self, embedding_model_name: str = 'all-MiniLM-L6-v2'):
        """
        初始化RAG系统
        """
        self.embedding_model = SentenceTransformer(embedding_model_name)
        self.index = None
        self.documents = []
        
    def build_index(self, documents: List[str]):
        """
        构建向量索引
        """
        # 生成文档嵌入
        embeddings = self.embedding_model.encode(documents)
        
        # 创建FAISS索引
        dimension = embeddings.shape[1]
        self.index = faiss.IndexFlatIP(dimension)  # 内积索引
        
        # 添加向量到索引
        self.index.add(np.array(embeddings, dtype=np.float32))
        
        self.documents = documents
        
    def retrieve(self, query: str, k: int = 5) -> List[Tuple[str, float]]:
        """
        检索相关文档
        """
        query_embedding = self.embedding_model.encode([query])
        similarities, indices = self.index.search(np.array(query_embedding, dtype=np.float32), k)
        
        results = []
        for i, (similarity, idx) in enumerate(zip(similarities[0], indices[0])):
            if idx < len(self.documents):
                results.append((self.documents[idx], similarity))
                
        return results

# 使用示例
rag_system = RAGSystem()

# 知识库文档
knowledge_base = [
    "Python是一种高级编程语言，具有简洁易读的语法特点",
    "机器学习是人工智能的一个分支，通过算法让计算机从数据中学习",
    "深度学习使用神经网络模型来处理复杂的数据模式",
    "自然语言处理技术可以理解和生成人类语言",
    "大数据技术用于处理和分析海量数据集"
]

# 构建索引
rag_system.build_index(knowledge_base)

# 检索查询
query = "Python编程语言的特点是什么？"
results = rag_system.retrieve(query, k=3)
print("检索结果：")
for doc, score in results:
    print(f"相似度: {score:.4f} - 内容: {doc}")

2.3 高级RAG优化技术

多路检索策略

class AdvancedRAGSystem(RAGSystem):
    def __init__(self, embedding_model_name: str = 'all-MiniLM-L6-v2'):
        super().__init__(embedding_model_name)
        self.dense_index = None
        self.sparse_index = None
        
    def build_hybrid_index(self, documents: List[str]):
        """
        构建混合索引（稠密+稀疏）
        """
        # 稠密向量索引
        dense_embeddings = self.embedding_model.encode(documents)
        dimension = dense_embeddings.shape[1]
        self.dense_index = faiss.IndexFlatIP(dimension)
        self.dense_index.add(np.array(dense_embeddings, dtype=np.float32))
        
        # 稀疏向量索引（简单词频）
        self.sparse_vectors = self._create_sparse_vectors(documents)
        
    def _create_sparse_vectors(self, documents: List[str]) -> List[Dict]:
        """
        创建稀疏向量表示
        """
        sparse_vectors = []
        for doc in documents:
            words = doc.lower().split()
            vector = {}
            for word in words:
                if word not in vector:
                    vector[word] = 1
                else:
                    vector[word] += 1
            sparse_vectors.append(vector)
        return sparse_vectors
        
    def hybrid_retrieve(self, query: str, k: int = 5, dense_weight: float = 0.7) -> List[Tuple[str, float]]:
        """
        混合检索：结合稠密和稀疏向量
        """
        # 稠密检索
        query_embedding = self.embedding_model.encode([query])
        dense_similarities, dense_indices = self.dense_index.search(
            np.array(query_embedding, dtype=np.float32), k*2
        )
        
        # 稀疏检索（简化实现）
        query_words = query.lower().split()
        sparse_scores = []
        for i, doc_vector in enumerate(self.sparse_vectors):
            score = 0
            for word in query_words:
                if word in doc_vector:
                    score += doc_vector[word]
            sparse_scores.append((i, score))
        
        # 排序并合并结果
        dense_results = list(zip(dense_indices[0], dense_similarities[0]))
        sparse_results = sorted(sparse_scores, key=lambda x: x[1], reverse=True)[:k*2]
        
        # 融合结果
        combined_scores = {}
        for idx, score in dense_results:
            combined_scores[idx] = score * dense_weight
            
        for idx, score in sparse_results:
            if idx in combined_scores:
                combined_scores[idx] += score * (1 - dense_weight)
            else:
                combined_scores[idx] = score * (1 - dense_weight)
        
        # 排序并返回前k个
        sorted_results = sorted(combined_scores.items(), key=lambda x: x[1], reverse=True)[:k]
        return [(self.documents[idx], score) for idx, score in sorted_results]

# 使用示例
advanced_rag = AdvancedRAGSystem()
advanced_rag.build_hybrid_index(knowledge_base)
hybrid_results = advanced_rag.hybrid_retrieve("机器学习技术", k=3)

重排序优化

def rerank_results(original_results: List[Tuple[str, float]], 
                  query: str, 
                  reranker_model) -> List[Tuple[str, float]]:
    """
    对检索结果进行重排序
    """
    # 准备重排序输入
    rerank_inputs = []
    for doc, score in original_results:
        input_text = f"{query} [SEP] {doc}"
        rerank_inputs.append(input_text)
    
    # 使用重排序模型
    scores = reranker_model.predict(rerank_inputs)
    
    # 重新排序
    results_with_scores = list(zip(original_results, scores))
    sorted_results = sorted(results_with_scores, key=lambda x: x[1], reverse=True)
    
    return [(doc, score) for (doc, _), score in sorted_results]

# 简化的重排序实现
class SimpleReranker:
    def __init__(self):
        self.model = SentenceTransformer('all-MiniLM-L6-v2')
        
    def predict(self, inputs: List[str]) -> List[float]:
        """
        简单的重排序逻辑：基于查询与文档的语义相似度
        """
        scores = []
        for input_text in inputs:
            # 分割查询和文档
            parts = input_text.split('[SEP]')
            if len(parts) >= 2:
                query = parts[0]
                doc = '[SEP]'.join(parts[1:])
                
                # 计算相似度
                embeddings = self.model.encode([query, doc])
                similarity = cosine_similarity([embeddings[0]], [embeddings[1]])[0][0]
                scores.append(similarity)
            else:
                scores.append(0.0)
        return scores

# 使用示例
reranker = SimpleReranker()
# 假设original_results是之前的检索结果
# ranked_results = rerank_results(original_results, "机器学习技术", reranker)

三、模型微调与定制化优化

3.1 微调策略选择

微调是提升LLM在特定任务上性能的重要手段。根据数据量和计算资源的不同，可以选择不同的微调策略：

from transformers import (
    AutoTokenizer, 
    AutoModelForCausalLM, 
    Trainer, 
    TrainingArguments,
    DataCollatorForLanguageModeling
)
import torch
from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self, texts, tokenizer, max_length=512):
        self.texts = texts
        self.tokenizer = tokenizer
        self.max_length = max_length
        
    def __len__(self):
        return len(self.texts)
        
    def __getitem__(self, idx):
        text = self.texts[idx]
        encoding = self.tokenizer(
            text,
            truncation=True,
            padding='max_length',
            max_length=self.max_length,
            return_tensors='pt'
        )
        return {
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten()
        }

def fine_tune_model(model_name: str, train_texts: List[str], 
                   output_dir: str, num_epochs: int = 3):
    """
    微调LLM模型
    """
    # 加载预训练模型和分词器
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    
    # 添加pad token
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token
        model.config.pad_token_id = model.config.eos_token_id
    
    # 准备数据集
    dataset = CustomDataset(train_texts, tokenizer)
    
    # 设置训练参数
    training_args = TrainingArguments(
        output_dir=output_dir,
        num_train_epochs=num_epochs,
        per_device_train_batch_size=4,
        gradient_accumulation_steps=4,
        warmup_steps=100,
        logging_steps=10,
        save_steps=500,
        learning_rate=5e-5,
        weight_decay=0.01,
        fp16=True,  # 使用混合精度训练
        report_to=None,
    )
    
    # 数据整理器
    data_collator = DataCollatorForLanguageModeling(
        tokenizer=tokenizer,
        mlm=False,  # 对于因果语言模型设置为False
    )
    
    # 创建训练器
    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=dataset,
        data_collator=data_collator,
    )
    
    # 开始训练
    trainer.train()
    
    # 保存模型
    trainer.save_model()
    tokenizer.save_pretrained(output_dir)
    
    return model, tokenizer

# 使用示例
train_data = [
    "用户：你好\n助手：您好！有什么我可以帮助您的吗？",
    "用户：我想了解机器学习\n助手：机器学习是人工智能的一个分支，通过算法让计算机从数据中学习规律和模式。",
    # 更多训练数据...
]

# fine_tuned_model, tokenizer = fine_tune_model(
#     "gpt2", 
#     train_data, 
#     "./fine_tuned_model", 
#     num_epochs=2
# )

3.2 适配器微调（Adapter Tuning）

适配器微调是一种更高效的微调方法，通过在预训练模型中插入小型可训练的适配器层来实现：

import torch.nn as nn
from transformers import PreTrainedModel, PretrainedConfig

class AdapterLayer(nn.Module):
    """
    适配器层实现
    """
    def __init__(self, config, adapter_size=64):
        super().__init__()
        self.adapter_size = adapter_size
        self.down_project = nn.Linear(config.hidden_size, adapter_size)
        self.up_project = nn.Linear(adapter_size, config.hidden_size)
        self.activation = nn.ReLU()
        
    def forward(self, x):
        down = self.down_project(x)
        activated = self.activation(down)
        up = self.up_project(activated)
        return x + up  # 残差连接

class AdapterConfig(PretrainedConfig):
    """
    适配器配置
    """
    def __init__(self, adapter_size=64, **kwargs):
        super().__init__(**kwargs)
        self.adapter_size = adapter_size

class AdapterModel(PreTrainedModel):
    """
    带适配器的模型实现
    """
    config_class = AdapterConfig
    
    def __init__(self, config):
        super().__init__(config)
        # 这里简化实现，实际应用中需要完整的模型结构
        self.model = AutoModelForCausalLM.from_pretrained("gpt2")
        self.adapters = nn.ModuleList([
            AdapterLayer(config) for _ in range(12)  # 假设有12层
        ])
        
    def forward(self, input_ids, attention_mask=None, labels=None):
        outputs = self.model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            labels=labels
        )
        return outputs

def create_adapter_model(model_name: str, adapter_size: int = 64):
    """
    创建适配器模型
    """
    config = AdapterConfig(adapter_size=adapter_size)
    model = AdapterModel(config)
    
    # 只训练适配器层，冻结预训练模型参数
    for param in model.model.parameters():
        param.requires_grad = False
        
    return model

# 使用示例
# adapter_model = create_adapter_model("gpt2", adapter_size=32)

四、推理优化与性能调优

4.1 推理加速技术

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from accelerate import Accelerator

class OptimizedLLMInference:
    """
    优化的LLM推理实现
    """
    def __init__(self, model_name: str, device: str = 'cuda'):
        self.device = device
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForCausalLM.from_pretrained(
            model_name,
            torch_dtype=torch.float16 if device == 'cuda' else torch.float32,
            low_cpu_mem_usage=True
        )
        
        # 设置设备
        if device == 'cuda':
            self.model = self.model.to(device)
            
        # 启用推理优化
        self.model.eval()
        
    def generate_optimized(self, prompt: str, max_length: int = 200, 
                          temperature: float = 0.7, top_p: float = 0.9) -> str:
        """
        优化的生成函数
        """
        # 编码输入
        inputs = self.tokenizer(
            prompt,
            return_tensors="pt",
            truncation=True,
            max_length=512
        ).to(self.device)
        
        # 生成参数设置
        generation_config = {
            'max_length': max_length,
            'temperature': temperature,
            'top_p': top_p,
            'do_sample': True,
            'pad_token_id': self.tokenizer.pad_token_id,
            'eos_token_id': self.tokenizer.eos_token_id,
        }
        
        # 生成文本
        with torch.no_grad():
            outputs = self.model.generate(**inputs, **generation_config)
            
        # 解码输出
        generated_text = self.tokenizer.decode(
            outputs[0],
            skip_special_tokens=True
        )
        
        return generated_text
    
    def batch_generate(self, prompts: List[str], max_length: int = 200) -> List[str]:
        """
        批量生成优化
        """
        # 批量编码
        inputs = self.tokenizer(
            prompts,
            return_tensors="pt",
            truncation=True,
            padding=True,
            max_length=512
        ).to(self.device)
        
        # 批量生成
        with torch.no_grad():
            outputs = self.model.generate(
                **inputs,
                max_length=max_length,
                do_sample=True,
                temperature=0.7,
                pad_token_id=self.tokenizer.pad_token_id,
                eos_token_id=self.tokenizer.eos_token_id,
                num_return_sequences=1
            )
            
        # 解码所有输出
        results = []
        for output in outputs:
            text = self.tokenizer.decode(output, skip_special_tokens=True)
            results.append(text)
            
        return results

# 使用示例
# inference_engine = OptimizedLLMInference("gpt2", device="cuda")
# result = inference_engine.generate_optimized("今天天气怎么样？")

4.2 动态批处理与缓存优化

from collections import OrderedDict
import time

class CacheManager:
    """
    缓存管理器
    """
    def __init__(self, max_size: int = 1000):
        self.cache = OrderedDict()
        self.max_size = max_size
        
    def get(self, key: str):
        if key in self.cache:
            # 移动到末尾（最近使用）
            self.cache.move_to_end(key)
            return self.cache[key]
        return None
        
    def put(self, key: str, value):
        if key in self.cache:
            self.cache.move_to_end(key)
        elif len(self.cache) >= self.max_size:
            # 删除最旧的项
            self.cache.popitem(last=False)
            
        self.cache[key] = value
        
    def clear(self):
        self.cache.clear()

class BatchInferenceEngine:
    """
    批量推理引擎
    """
    def __init__(self, model_name: str, batch_size: int = 8):
        self.model = OptimizedLLMInference(model_name)
        self.batch_size = batch_size
        self.cache = CacheManager(max_size=500)
        
    def process_queries(self, queries: List[str]) -> List[str]:
        """
        处理查询列表，包含缓存和批处理优化
        """
        results = []
        batch = []
        
        for query in queries:
            # 检查缓存
            cached_result = self.cache.get(query)
            if cached_result is not None:
                results.append(cached_result)
                continue
                
            # 添加到批次
            batch.append(query)
            
            # 当批次满时处理
            if len(batch) >= self.batch_size:
                batch_results = self.model.batch_generate(batch)
                for result in batch_results:
                    results.append(result)
                    
                # 缓存结果
                for i, query_item in enumerate(batch):
                    self.cache.put(query_item, batch_results[i])
                    
                batch = []
        
        # 处理剩余的批次
        if batch:
            batch_results = self.model.batch_generate(batch)
            for result in batch_results:
                results.append(result)
                
            # 缓存结果
            for i, query_item in enumerate(batch):
                self.cache.put(query_item, batch_results[i])
                
        return results

# 使用示例
# batch_engine = BatchInferenceEngine("gpt2", batch_size=4)
# queries = ["你好", "今天天气怎么样？", "如何学习编程？"]
# results = batch_engine.process_queries(queries)

4.3 内存优化与量化技术

import torch.nn.utils.prune as prune

class QuantizedLLM:
    """
    量化优化的LLM模型
    """
    def __init__(self, model_name: str):
        self.model = AutoModelForCausalLM.from_pretrained(
            model_name,
            torch_dtype=torch.float16
        )
        
    def apply_quantization(self):
        """
        应用量化技术
        """
        # 动态量化（适用于CPU）
        if torch.backends.quantized.is_available():
            self.model = torch.quantization.quantize_dynamic(
                self.model, {torch.nn.Linear}, dtype=torch.qint8
            )
            
    def apply_pruning(self, pruning_ratio: float = 0.3):
        """
        应用剪枝技术
        """
        # 对所有线性层应用剪枝
        for name, module in self.model.named_modules():
            if isinstance(module, torch.nn.Linear):
                prune.l1_unstructured(module, name='weight', amount=pruning_ratio)
                prune.remove(module, 'weight')
                
    def get_model_size(self) -> int:
        """
        获取模型大小（字节）
        """
        total_size = 0
        for param in self.model.parameters():
            total_size += param.nelement() * param.element_size()
        return total_size

# 使用示例
# quantized_model = QuantizedLLM("gpt2")
# quantized_model.apply_quantization()
# model_size = quantized_model.get_model_size()

五、实际应用案例与最佳实践

5.1 智能客服系统实现

class IntelligentCustomerService:
    """
    智能客服系统实现
    """
    def __init__(self, rag_system, llm_engine):
        self.rag = rag_system
        self.llm = llm_engine
        self.conversation_history = []
        
    def process_query(self, user_query: str) -> str:
        """
        处理用户查询
        """
        # 1. 检索相关文档
        retrieved_docs = self.rag.retrieve(user_query, k=3)
        
        # 2. 构建上下文
        context = "\n".join([doc for doc, _ in retrieved_docs])
        
        # 3. 创建增强Prompt
        prompt = f"""
        请基于以下知识库内容回答用户问题：
        
        知识库信息：
        {context}
        
        用户问题：{user_query}
        
        请提供专业、准确且友好的回答。
        """
        
        # 4. 生成答案
        answer = self.llm.generate_optimized(
            prompt, 
            max_length=300,
            temperature=0.7
        )
        
        # 5. 记录对话历史
        self.conversation_history.append({
            'user_query': user_query,
            'answer

大语言模型(LLM)应用开发最佳实践：从Prompt Engineering到RAG检索增强生成技术

引言

一、Prompt Engineering：构建高效LLM交互的关键

1.1 Prompt工程基础概念

1.2 Prompt设计最佳实践

指令清晰化

提供上下文信息

温和指令与具体要求

1.3 Prompt优化技术

Chain-of-Thought (CoT) 思维链

Zero-shot、Few-shot与In-context Learning

二、RAG检索增强生成技术详解

2.1 RAG核心技术原理

2.2 RAG系统架构实现

2.3 高级RAG优化技术

多路检索策略

重排序优化

三、模型微调与定制化优化

3.1 微调策略选择

3.2 适配器微调（Adapter Tuning）

四、推理优化与性能调优

4.1 推理加速技术

4.2 动态批处理与缓存优化

4.3 内存优化与量化技术

五、实际应用案例与最佳实践

5.1 智能客服系统实现

相似文章

评论 (0)

大语言模型(LLM)应用开发最佳实践：从Prompt Engineering到RAG检索增强生成技术

引言

一、Prompt Engineering：构建高效LLM交互的关键

1.1 Prompt工程基础概念

1.2 Prompt设计最佳实践

指令清晰化

提供上下文信息

温和指令与具体要求

1.3 Prompt优化技术

Chain-of-Thought (CoT) 思维链

Zero-shot、Few-shot与In-context Learning

二、RAG检索增强生成技术详解

2.1 RAG核心技术原理

2.2 RAG系统架构实现

2.3 高级RAG优化技术

多路检索策略

重排序优化

三、模型微调与定制化优化

3.1 微调策略选择

3.2 适配器微调（Adapter Tuning）

四、推理优化与性能调优

4.1 推理加速技术

4.2 动态批处理与缓存优化

4.3 内存优化与量化技术

五、实际应用案例与最佳实践

5.1 智能客服系统实现

相似文章

评论 (0)

选择表情