主页

【AI】Reinforcement Learning

Reference Key concepts A (Long) Peek into Reinforcement Learning Policy Gradient Policy Gradient Algorithms Key Concepts What 定义 The agent’s policy $\pi(s)$ provides the guideline on what is the optimal action to take in a certain state with the goal to maximize the total rewards. 关键词,在某个state下,采取何种策略,能够...

阅读更多

【AI】LLM Deep Dive

Overview 什么是LLM? LLM的Intuitive是什么? LLM的原理是什么,底层是如何实现的? 相比于其他方法,LLM为什么能够达到更好的效果? LLM产业运行的难点在哪里? 如果我现在起步,做和LLM什么相关工作比较好?机会点在哪里? 如果有一个LLM相关工作的Roadmap,这个Roadmap是什么? 如何与我现在的工作内容产生联系,让我更好起步? 因为我算是LLM领域的小白,所以我想从NLP的历史出发,看看如何一步步演变成目前的形态。 Background NLP的Intuitive是什么?为什么这种方法可行。 Intuitive Statistical Model 参考这篇2001年的论文A Bit of Prog...

阅读更多

【AI】06/07 Github Trending

Top-5 Summary TransformerOptimus/SuperAGI SuperAGI是一个用于构建和运行有用的自主代理的框架。SuperAGI旨在构建基础设施,以实现这一目标。使用SuperAGI,您可以提供、生成和部署有用的自主人工智能代理。简单来说,SuperAGI是一套带UI界面的解决方案,你可以构建自己的数据库,embedding等,通过OpenAI的接口来和数据库的内容交互。 ruanyf/weekly 一个科技爱好者周刊 mlc-ai/mlc-llm MLC LLM(多语言模型转换与优化引擎)是一个通用解决方案,可以使任何语言模型在各种硬件后端和...

阅读更多

Ai Home

25/09/2024 <a href=/ai/ai_algorithms/vision/2024/09/25/vllm-survey.html title=AI> 【AI】VLLM Survey </a> 26/08/2024 <a href=/ai/ai_algorithms/vision/2024/08/26/mm-evol.html title=AI> 【AI】MiniCPM-V:端侧图像大模型 </a> 26/08/2024 <a href=/ai/ai_algorithms/vision/2024/...

阅读更多

【AI】LLM Thoughts

背景 可能是最近才开始关注Github上关于LLM和AIGC的更新,用日新月异来形容毫不过分。每天的Github trending都在变,而且绝大部分都是关于AI,非相关内容已经排不上trending了。 2016年AlphaGo出来下棋的时候,还没有体会到AI能够发展成为今天的样子,因为把棋下好这件事和日常生活提效,或者是人工智能取代人工这个构想之间的逻辑关系过于大,不光大头兵们,大佬们肯定也没想到,不然他们早就入局了,不至于OpenAI都做出来了才都纷纷带着自己的家底入场。 对于一个从事编程行业的人来说,哪些应该是我的关注点呢? Breakdown 首先,大模型大概率没法做。这个事情没有多少资本都没有入场券那种,不过我倒是很好奇,如果在现在的模型基础上做fine-tune...

阅读更多

【Basics】Useful Prompts

Prompt Techniques Specific Prompts Scala Prompts Incremental Id assignment suppose I have a rdd called edgeDF which has src_id, dst_id columns. Now I want to turn srd_id and dst_id into a single column called vertex_id. Each vertex_id is unique and assign a new column called id with incremental number. Finally, I want to assign...

阅读更多

【阅读】The Tyranny of Merit. 傲慢的精英

综述 interesting,优绩至上理论竟然会带来很大的副作用,而且其中一个甚至和看起来毫不相干的信奉上帝有关。 信奉上帝相信我们做了善行,那么上帝会根据这个善行给予我们奖赏,反之会给我们惩罚。因此当一个人极度不幸的时候,很多人甚至怀疑这个人其实做过一些不为人知的恶行,这加深了对受难者的伤害。

阅读更多

【阅读】kknmd house

KK关于房价的思考 洞见事务背后的运行逻辑,是预测未来发展的重要因素。如果希望自己有一定的预测能力,需要对以下几点进行加强 掌握足够优质的信息来源; 对经济运行有较为充足的知识储备; 对历史的发展规律及其背后的原因有足够的了解; 基于这些了解能够产出action items。 一些摘抄 关于房产投资的方向,也有几点心得:供大家参考: 一、坚决不能投资自己不熟悉的城市 二、坚决不投资中小城市,一般省会及计划单列以上城市问题都不大,但中小城市即使房价上涨也存在变现困难问题。 三、坚决不投资距离大城市较偏远的旅游城市,比如山东乳山之类的,几乎无法变现。 四、慎重投资大城市的郊区,除非价格绝对低。如果外来人口比较多,zf又有发展规划,且价格与城区相比有较大的...

阅读更多