简介
自从发现可以利用自有数据来增强大语言模型(LLM)的能力以来,如何将 LLM 的通用知识与个人数据有效结合一直是热门话题。关于使用微调(fine-tuning)还是检索增强生成(RAG)来实现这一目标的讨论持续不断。检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 (LLM),此类模型会使用检索到的信息生成可供阅读的文本回复)结合在一起。
2025年03月25日
简介
自从发现可以利用自有数据来增强大语言模型(LLM)的能力以来,如何将 LLM 的通用知识与个人数据有效结合一直是热门话题。关于使用微调(fine-tuning)还是检索增强生成(RAG)来实现这一目标的讨论持续不断。检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 (LLM),此类模型会使用检索到的信息生成可供阅读的文本回复)结合在一起。
2025年03月25日
构建大规模、全面的数据集来测试 LLM 输出可能是一个费力、昂贵且具有挑战性的过程,尤其是从头开始构建时。但是,如果我告诉你,现在只需几分钟就可以生成通常花费数周精心制作的数千个高质量测试用例,你会怎么想?
2025年03月25日
下来我们进入数据持久化的部分,对于一个真实的业务系统,能够正常的运转离不开数据的持久化。在数据持久化这块,目前主流的还是关系型数据库(RDBMS),NoSQL(NewSQL)也有了长足发展,特别在大数据领域。
2025年03月25日
简介: 让你的DO(业务实体对象),DTO(数据传输对象)数据转换更简单强大
在软件架构中,分层式结构是最常见,各层之间有其独立且隔离的业务逻辑,也因而各层有自己的输入输出对象,也就是代码中见到各种O,如DO、DTO、VO,这些数据对象之间通常都有很多相同或相近的属性对象,数据在传输的过程中从一个O到另一个O,就通常需要赋值,从最初的的get/set
2025年03月25日
在百度,Hadoop主要应用于以下几个方面:
日志的存储和统计;
网页数据的分析和挖掘;
2025年03月25日
我们书写代码一般分为三层,控制层(Controller),业务层(Service),持久层(Dao),一般我们从http请求到数据库获取数据,一般都是经历这三大层次,Controller一般我们不需要进行处理业务逻辑,只是简单的一些数据的转换之类的,Service层一般具体是我们的业务逻辑层,需要按照我们自己业务上逻辑进行处理包装,Dao层一般是持久层,就是mapper操作数据库的,不过,我一般建议在Service进行细分,我会细分为简单的内部代理InnerService和处理复杂逻辑的Service,其实就是业务逻辑处理类不直接调用dao操作数据库,而是经过inner层进行调用,在inner层我们可以做一下数据的非空以及其他的判断处理,具体的细分,可以参考下面的代码结构。