主页

【AI】LLM RL Modeling

RL Recap RL Model LLM Description 根据上一个states,经过一个LLM,生成另一个states,一共生成max_tokens作为一次生成。生成的长度是prompt_len + max_token。 Modeling Objective 生成尽可能多的Correct Format。 States Input of current methods

阅读更多

【Blog】Structural Thinking

Overview 为什么突然想写这样一篇文章?因为最近我发现所有东西想做好,都需要有一套自己的SOP。简单来说就是一个structural thinking,对于一个较为常见的问题,有一个固定的思考套路。当然这不是说这个套路就是固定不变的,是说首先需要有,其次是需要根据这个套路不断迭代,优化这个套路直到这个套路可以快速的解决问题。可以是学习相关的,可以是工作相关的,但总体来说,我认为人就是他自己方法论的总和,这些方法论优化的越好,事情做的漂亮的可能性就越大。 Study Algorithm Algorithm类的本身比较单点,就是一个算法,但是可以发散的很多。比如有些算法其实是另一些算法的改进版,那光了解这一个算法肯定是不行的,需要了解之前的算法,而当一个算法需要的背景知识过多...

阅读更多

【AI】Reinforcement Learning

Reference Key concepts A (Long) Peek into Reinforcement Learning Policy Gradient Policy Gradient Algorithms Key Concepts What 定义 The agent’s policy $\pi(s)$ provides the guideline on what is the optimal action to take in a certain state with the goal to maximize the total rewards. 关键词,在某个state下,采取何种策略,能够...

阅读更多

【AI】LLM Deep Dive

Overview 什么是LLM? LLM的Intuitive是什么? LLM的原理是什么,底层是如何实现的? 相比于其他方法,LLM为什么能够达到更好的效果? LLM产业运行的难点在哪里? 如果我现在起步,做和LLM什么相关工作比较好?机会点在哪里? 如果有一个LLM相关工作的Roadmap,这个Roadmap是什么? 如何与我现在的工作内容产生联系,让我更好起步? 因为我算是LLM领域的小白,所以我想从NLP的历史出发,看看如何一步步演变成目前的形态。 Background NLP的Intuitive是什么?为什么这种方法可行。 Intuitive Statistical Model 参考这篇2001年的论文A Bit of Prog...

阅读更多

【AI】06/07 Github Trending

Top-5 Summary TransformerOptimus/SuperAGI SuperAGI是一个用于构建和运行有用的自主代理的框架。SuperAGI旨在构建基础设施,以实现这一目标。使用SuperAGI,您可以提供、生成和部署有用的自主人工智能代理。简单来说,SuperAGI是一套带UI界面的解决方案,你可以构建自己的数据库,embedding等,通过OpenAI的接口来和数据库的内容交互。 ruanyf/weekly 一个科技爱好者周刊 mlc-ai/mlc-llm MLC LLM(多语言模型转换与优化引擎)是一个通用解决方案,可以使任何语言模型在各种硬件后端和...

阅读更多

Ai Home

28/05/2025 <a href=/ai/ai_algorithms/vision/2025/05/28/qwen3.html title=AI> 【AI】Qwen3 - 基模搞得好,变现少不了 </a> 13/05/2025 <a href=/ai/ai_algorithms/vision/2025/05/13/seed-15-vl.html title=AI> 【AI】看完Seed-1.5-VL技术报告,立刻可尝试的几件事 </a> 22/04/2025 <a href=/ai/ai_algorith...

阅读更多

【AI】LLM Thoughts

背景 可能是最近才开始关注Github上关于LLM和AIGC的更新,用日新月异来形容毫不过分。每天的Github trending都在变,而且绝大部分都是关于AI,非相关内容已经排不上trending了。 2016年AlphaGo出来下棋的时候,还没有体会到AI能够发展成为今天的样子,因为把棋下好这件事和日常生活提效,或者是人工智能取代人工这个构想之间的逻辑关系过于大,不光大头兵们,大佬们肯定也没想到,不然他们早就入局了,不至于OpenAI都做出来了才都纷纷带着自己的家底入场。 对于一个从事编程行业的人来说,哪些应该是我的关注点呢? Breakdown 首先,大模型大概率没法做。这个事情没有多少资本都没有入场券那种,不过我倒是很好奇,如果在现在的模型基础上做fine-tune...

阅读更多

【Basics】Useful Prompts

Prompt Techniques Specific Prompts Scala Prompts Incremental Id assignment suppose I have a rdd called edgeDF which has src_id, dst_id columns. Now I want to turn srd_id and dst_id into a single column called vertex_id. Each vertex_id is unique and assign a new column called id with incremental number. Finally, I want to assign...

阅读更多