ShowMeAI周刊 No.14 | 上周AI领域热门讨论的9大话题:谷歌在教育领域反击成功,阶跃科技勇攀高峰,AI的实际应用仍有待探索...

频道:最新资讯 日期:

ShowMeAI周刊 No.13


1. Learn About:继 NotebookLM 之后又一个 AI Native 产品,谷歌真正的 AI Native Education 尝试


2. ima.copilot V.S. 秘塔 V.S. 天工:国区 Perplexity 青出于蓝而胜于蓝,秘塔一骑绝尘


3. Markdown:技术圈 (最) 常用的文本编辑语言,一种「四通八达」的中转格式 ⇨ 附上好用的转换工具


4. 把 17 岁高中生涂津豪的 Thinking Claude 提示词,设置在 Cursor 里


5. 两篇优秀的AI编程教程:跟着资深工程师 & 全栈开发者,挖掘 LLM 编程能力的极限


6. 恭喜阶跃星辰!step-2 在 LiveBench 榜单杀进前5,斩获国产大模型第1名 ⇨ 顺带聊聊榜单和测评的「内幕」


7. 举个栗子:当把大模型「开源」用「做饭-吃饭」来解释,一起都豁然开朗起来 ⇨ 甚至还玩起了谐音梗


8. 很有共鸣为什么大部分人用不起来 AI?可能还没体验到效率飞升的 Aha Moment


9. 集体讨论:大家都是怎么快速处理长视频、长音频、长文本材料的?都有哪些工作流和工具的配合应用?



1.

Google Learn About:继 NotebookLM 之后又一个 AI Native 产品,真正的 AI Native Education 尝试



Learn About 是 Google 11月份推出的AI学习工具,可以帮助个性化探索历史、艺术、自然、生物、物理、科学、经济、个人成长等方方面面的话题。


丰富的交互内容 & 交互形式,是 Learn About 最核心的特色。



输入提示词 (英文) 后,进入对话页面。


Learn About 右侧是当前话题的信息流,左侧是拓展查询列表。


右侧页面,可以看到样式丰富的内容板块;左侧页面,点击问题或者输入追问,可以进一步下钻话题????




Learn About 最值得称道的部分,就是样式丰富的交互卡片 ????


经过群友们的共同测试,目前发现了以下8种卡片,引起「哇」声一片:


  • 图文并茂
  • 视频推荐
  • 关键词释义
  • 相关概念链接
  • 话题要点总结
  • 澄清常见误区
  • 互动示例 (多轮追问)
  • 测验考题 (多轮追问)


资料链接 ✦✦


目前仅限美国IP和英文交互


Learn About 官网链接 → https://learning.google.com/experiments/learn-about


Google LearnLM 模型



Learn About 使用了 LearnLM,是 Google 今年5月份推出的 Gemini 系列模型之一,专门面向学习场景进行了微调。


LearnLM 以教育研究为基础,核心目标是构建个性化的学习体验。原理如上图左侧所示 ????


目前,除了 Learn About 这款产品外,LearnLM 还被用于 Google Search AI Overview、Youtube 学术视频问答等产品中。


你也可以在 Google AI Studio 里直接与模型对话。如上图右侧所示。


资料链接 ✦✦


LearnLM 官方介绍 → https://blog.google/outreach-initiatives/education/google-learnlm-gemini-generative-ai


LearnLM 技术报告 → https://storage.googleapis.com/deepmind-media/LearnLM/LearnLM_paper.pdf


Google AI Studio → https://aistudio.google.com


南瓜博士的体验视频录屏 → https://meeting.tencent.com/crm/2jvkJdob9d


⋙ 认真用 Learn About 学习一周后,我总结了七个使用要点 @南瓜博士


讨论交流 ✦✦


????‍♀ Learn About 创新点在于,借鉴了传统线上教育的学习体验,但在效率方面实现了巨幅超越。


启发式问答、大量学习资料、要点整理与总结、互动测验与答案解析… 传统线上教育需要花费大量时间人力去构建的、可以说是护城河之一的东西,就这么被AI轻轻击碎了。


海外的线上教育平台估计会被深深 Shock 一下。


????‍ 从 ChatGPT 线性的文本聊天窗口,到 Learn About 交互丰富的多模态内容信息流,终于看到一点 AI Native Education 的影子了!


OpenAI 本周推出 面向 K12 教师的免费AI培训课程,可汗学院 (OpenAI 教育合作伙伴) 创始人接受采访,都还是老思路 — 用AI助手进行单点的辅助或加强。


可以说,在AI教育这个方向上,Google 已经领先了 OpenAI 一个版本。


????‍ 官方声明和我们的测试都表明,Learn About 目前还是一款实验性产品,响应质量并不稳定。


可能会推荐不相关的学习资料、可能会在两三轮交互后话题跑偏,也可能因为网络等原因导致学习记录丢失。注意保持合理期待~


2.

ima.copilot V.S. 秘塔 V.S. 天工:国区 Perplexity 青出于蓝而胜于蓝,秘塔一骑绝尘


腾讯 ima.copilot、秘塔AI搜索、天工AI搜索,这三家陆续上线了「知识库」类板块,增加了 RAG 功能,并在尝试与生态内的其他板块构建联系。


用同一份文档 (《梁宁·产品经理三十讲》课程笔记) 和同一个问题 (我想创建一个人工智能学习路径的网站,但是没有思路。请问要有什么建议么) 对三者进行了测试,效果和分析如下 ????


天工:要再等等?



在搜索时直接上传文件,就能实现「定制AI搜索信息源」的效果。


问答页面如上,目前支持对话追问,支持脑图的图片下载。


总结-原文的对应、文本编辑、笔记、下钻探索… 这些功能目前都还不支持 ????


特别是,没有打通「彩页」「宝典」这两个很出彩的板块,也没有跟音乐创作、图片创作等等功能连接起来,形成一个完整的「创作-发布」AIGC 工作流。


整体而言,RAG 能力不错,但产品仍处于早期版本的状态。


资料链接 ✦✦

天工AI搜索 → https://www.tiangong.cn


秘塔:好用!特别好用!


秘塔的整体流程更长,也更完整。


ShowMeAI周刊 No.13


首先,需要构建专题,并上传文档或者复制网页链接。上图是官方专题的示例 ????


然后,在搜索框左下角选中专题,就可以定制本次AI搜索的数据源。



搜索完成后,操作类型也非常丰富。


可以继续当前话题进行追问,可以将答案导出成 Word/PDF 文档;可以收藏到专题,可以保存到秘塔写作猫并继续编辑,也可以生成在线的演示文稿 (PPT) 。


可以下载脑图的图片,还可以点击大纲中每个小项,查看与原文的对应关系,并完成进一步的搜索。


创作-编辑-分享,目前秘塔的 AIGC 工作流已经初具雏形!RAG 和搜索能力都很好!


妥妥的国产之光 (* ̄3 ̄)╭


资料链接 ✦✦


秘塔AI搜索 → https://metaso.cn


ima.copilot:有点简陋



腾讯的 ima.copilot 测试下来,使用体验最流畅的工作流有3类。


第一类,文档解读。


首页点击文档解读,从知识库添加文档,或者上传本地文档。


输入问题,ima 作答,并会引用公众号资料作为参考。


BUT!问题也出在这一步,ima 的回答跟上传的文档,基本没什么关系 ???? RAG 能力有点弱啊。


回答的底部,可以点击「记笔记」,顺利在应用内新建笔记文档。


第二类,阅读公众号文章。


复制公众号链接即可开始阅读。


右侧聊天窗口,可以通过系统默认提示词,快速总结文章要点。


左侧正文窗口,选中部分内容后,可以点击AI解读和翻译按钮。


AI回答和正文选中内容,都可以点击「记笔记」。


第三类,搜索查看各种政策类文章。


一是因为公众号内容更新非常快。


二是因为有官方公众号发布的权威内容。


总而言之,ima.copilot 最大的优势,就是守着公众号这座内容金山。


知识库内搜索、笔记内搜索,目前都做得一般。


资料链接 ✦✦


腾讯 ima.copilot → https://ima.qq.com


@samu 总结的常见知识管理工具清单


越来越觉得,各种知识类AI应用,比如订阅、检索、笔记等等,都在往同一个方向发展,即 AIGC 内容创作工作流,并且有向内容平台衍化的趋势。


或许 AI+搜索+RAG 也不是终点,AIGC 内容创作平台才是。


密切关注清单中的产品后续发展 ????


RSS 订阅


  • Feedly:feedly.com
  • InoReader:innoreader.com
  • Follow:follow.is
  • TidyRead:tidyread.ai


搜索


  • Google:google.com
  • 百度:baidu.com
  • axiv:arxiv.org
  • 天工:tiangong.cn
  • 秘塔:metaso.cn
  • ThinkAny:thinkany.so
  • Devv:devv.ai (daiwu.cn)


思维导图/思考白板


  • XMind:xmind.net
  • AIFlow
  • FunBlocks:app.funblocks.net


文档


  • Evernote:evernote.com
  • Notion:notion.so
  • 飞书:feishu.cn
  • 语雀:yuque.com
  • Flomo:flomoapp.com


海报


  • fastposter:fastposter.net
  • 吉光卡片 (Kiko Card)
  • 流光卡片:fireflycard.shushiai.com
  • molypix:molypix.ai


讨论交流 ✦✦


其实!已经有聪明的开发者注意到了上方提到的衍化趋势,并开始构建 AI-Native 内容创意和共享平台,比如 ↓↓↓


Pi智能演示文档,新一代图文内容创作、内容分享展示的新载体。


网站 → https://pi.deepvinci.tech


同名微信小程序


3.

Markdown:技术圈 (最) 常用的文本编辑语言,一种「四通八达」的中转格式 ⇨ 附上好用的转换工具


Markdown 简介



Markdown 是一种标记语言,对应文件格式为 .md,可以使用线上网站或 Typora 等编辑软件打开。


通俗一点说就是,Markdown 语法可以用纯文本完成全部排版。


例如,#文本 表示一级标题,**文本** 表示加粗,*** 表示分割线,[文本](链接) 表示超链接。


上图 ???? 展示了更多常见语法和呈现效果,例如居中、表格、图片、代码、引用、公式、有序列表/无序列表等等。


资料链接 ✦✦


图片来源 → https://sqlbak.com/blog/wp-content/uploads/2020/12/Jupyter-Notebook-Markdown-Cheatsheet2.pdf


为什么要重视 Markdown 语法呢?


因为它真的既常见又重要,既方便又快捷!


Markdown 加减几个符号就能搞定排版,不同编辑器之间兼容良好,而且还能转成 Word、PDF、txt 等等其他本地文档格式。


我们最常用的飞书、语雀、Notion 等在线文档,技术圈常用的 GitHub、Reddit、CSDN、掘金等交流论坛或内容平台,一般也支持 Markdown 语法。


而且,大语言模型的输入和输出,默认也是 Markdown 语法。


可以说,搞定文本内容的 Markdown 版本,是后续很多操作的必要前提。


Jina Reader:把任何网页转换为 Markdown



Jina Reader 是一个网页解析器。


一般情况下,只需要在浏览器网址前面添加 https://r.jina.ai/ 字符串,就可以把当前 URL 转换为 Markdown 语法格式的文本。比如:


https://news.ycombinator.com

↓↓↓

https://r.jina.ai/https://news.ycombinator.com



开发者可以使用 Jina AI 提供的免费 API,将 Reader 集成到自己工作流里。


其中有两个参数最重要,一个是返回格式,一个是超时时间:


curl https://r.jina.ai/https://news.ycombinator.com 

  -H "X-Return-Format: markdown" 

  -H "X-Timeout: 30"


资料链接 ✦✦


Reader 还支持 PDF 解析、选择特定网页元素输出等等各种玩法,也包括这种高端操作 ???? (据说是 Jina AI 最接地气的产品)


Reader 官网链接 → https://jina.ai/reader


GitHub → https://github.com/jina-ai/reader ⭐7K


常用 Markdown 编辑器


线上 Markdown 编辑器


  • StackEdit:https://stackedit.io
  • Cmd Markdown:https://zybuluo.com


本地 Markdown 编辑器


  • Typora:https://typora.io
  • Obsidian:https://obsidian.md
  • Atom:https://atom-editor.cc
  • Sublime Text:https://www.sublimetext.com


讨论交流 ✦✦


Markdown 应用场景之一:公众号排版


本周,@南瓜博士 分享了她在 Obsidian 软件里使用 Markdown 编辑文本后,直接复制到公众号后台的操作 ↓↓↓


⋙ 超便捷的Markdown转公众号排版


4.

把 17 岁高中生涂津豪的 Thinking Claude 提示词,设置在 Cursor 里



@laughing哥 把 Thinking Claude 提示词集成在了 Cursor 编辑器里,让AI助手能够展现出更深入的思考过程,帮助提供更深入的问题分析,并且生成更有质量的回答


当前支持 Claude 和 Qwen 模型。


Claude 优势


  • 深度思考链路展示
  • 结构化推理过程
  • 多语言支持
  • 代码分析能力强


Qwen 优势


  • 中文思维链路优化
  • 简洁的思考展示
  • 适合国内用户
  • 响应速度快


资料链接 ✦✦


除了争论这段提示词是否够「神」之外,也可以用来做点别的 ↓↓↓


GitHub → https://github.com/flashclub/thinking-cursor-rules


5.

两篇优秀的AI编程教程:跟着资深工程师 & 全栈开发者,挖掘 LLM 编程能力的极限


How I Use AI



作者 Nicholas Carlini 是一位真真正正的技术大佬!


在 MIT 念完 CS+Math 本科后,又拿到了 MIT 博士学位,随后进入大名鼎鼎的 Google DeepMind 工作担任科学家,研究方向还是自然语言处理!!


他的博文「How I Use "AI"」非常出圈,是使用 LLM 进行编程和研究的实例分享,并都给出了完整的提示词 ????


有些任务的提示词真的超级长!而这只是 Nicholas 过去一年实践「冰山一角」????


  • 构建一个完整的 Web 应用。作者用 GPT-4 构建了一个在线测试小工具,并获得了超过千万次的页面浏览量。
  • 学习新技术。通过与模型的互动式对话,学习 Docker、Flexbox 和 React 等新技术
  • 开启新项目。借助AI快速获取新项目或者新论文所需的样板代码,尤其是框架不熟悉的场景里。
  • 简化代码。遇到复杂的大型代码库,用AI进行简化后更容易理解。
  • 单调任务的自动化。把单调且简单的任务交给AI,比如数据格式化等。
  • 提升用户专业度和效率。在AI的帮助下,普通用户也可以像专家那样完成很多工作。
  • API Reference。通过AI获取特定工具或命令的使用信息,不必再翻看查找文档。
  • 搜索。AI搜索效果比传统搜索引擎好很多。
  • 解决一次性的任务。只需要运行一次的小脚本或程序,用AI编写起来省时又省力。
  • 常见任务的解决方案。你遇到的大部分任务,都已经发生并且有解决方案了,而这部分是 LLM 最擅长的。
  • 修复常见错误。编程中遇到问题时,通过 LLM 问答往往比传统搜索更高效。


资料链接 ✦✦


这轮 LLM 浪潮有炒作的成分,但已经达到了可用的程度 ↓↓↓


How I Use "AI" → https://nicholas.carlini.com/writing/2024/how-i-use-ai.html


idoubi



@idoubi 是目前国内知名的AI全栈开发者。


他最近分享了AI辅助编程工具的使用经验,并且配有详细的文字说明和配图演示。


这应该是我看过的、最完整的AI编程经验分享长文。


话题1:作为一个专业程序员,如何使用 Cursor 提高编码效率


  • 自动补全代码
  • Debug && Fix Error
  • 实时对话 && 联网搜索
  • 写提示词
  • 写前端页面
  • 截图生成组件
  • 写常用的代码逻辑/函数
  • 代码重构
  • 多语言翻译


话题2:零代码基础,如何使用AI辅助编程工具实现自己的想法


  • 使用 Cursor Composer 构建产品
  • 使用 Bolt.new 构建产品
  • 使用 Claude 构建单页应用
  • 使用 v0.dev 生成组件
  • 使用 Pagen 生成落地页


话题3:盘点常用的AI辅助编程工具和使用场景


  • Al编辑器:Cursor,Windsurf,Pear Al
  • 编辑器 Al 扩展:Github Copilot,Continue,Cline
  • Ul组件生成工具:Cursor,v0.dev,Claude,screenshot-to-code
  • 完整项目构建工具:Cursor,Bolt.new,Replit Agent,Wordware


资料链接 ✦✦


一个真正优秀且专业的程序工程师,是不可能被AI淘汰的 ↓↓↓


⋙ 我用AI辅助编程,效率提升 x 倍 @idoubi


讨论交流 ✦✦


@idoubi 在文章末尾提到了AI工具的选择。


这也是大家平时最关心 & 喜欢讨论的话题之一。以下整理了3种选择思路。其实,我们每个人都可以有一份自己的偏好清单~


????‍???? 如何选择AI辅助编程工具 @idoubi


使用场景


  • 每天高频写代码或深度依赖AI辅助编程工具:Cursor,Windsurf
  • 偶尔写 Demo 验证想法或偶尔写 UI 组件:Bolt.new,v0.dev,Claude


经济成本


  • 习惯为优质工具产品付费:升级 Cursor Pro 会员
  • 希望找到低价的 Cursor 替代方案:使用 Windsurf (订阅费是 Cursor 的一半)


使用习惯


  • 习惯于 VS Code 编程:Cursor,Windsurf
  • 想安装AI辅助编程插件:Github Copilot,Continue,Cline


????‍???? 我目前在用哪个 LLM 模型 @孔某人的低维认知


  • API与开发场景:Claude 3.5 Sonnet,o1 系列
  • Chat:常规问题用 ChatGPT 的 gpt-4o,复杂问题或设计 WorkFlow用 Claude
  • 写作:在观点调研和改错别字时使用 o1-preview
  • 开发:在 Cursor 中使用 Claude 3.5 Sonnet 20241022 进行代码修改或开发,在 Web 窗口使用 gpt-4o 进行技术方案调研
  • AI搜索:PC端使用 Google,公众号搜索使用腾讯元宝


????‍???? My AI Usage these days @Elvis Saravia


  • claude-3.5-sonnet:用于大多数创意和写作任务
  • Gemini-1.5-Pro:用于视频相关任务
  • ChatGPT:用于图像分析和 Web 搜索
  • GPT-4o-mini 和 Gemini-Flash:用于 Agent 任务
  • o1-mini:用于推理和知识密集型任务
  • llama-3.1:用于本地 LLM
  • Midjourney:用于图像生成
  • Runway:用于视频生成
  • ElevenLabs:用于语音相关内容


6.

恭喜阶跃星辰!step-2 在 LiveBench 榜单杀进前5,斩获国产大模型第1名 ⇨ 顺带聊聊常用榜单和测评「内幕」



过去的一周,阶跃星辰可谓风光无限 ????


先是自研大模型 Step-2 登上了 LiveBench 榜单第 5 名。榜单中的下一个国产大模型是 Qwen 2.5,排在第 13 名。


再是多模态理解大模型 Step-1V 在 LMSYS Viosn 榜单再次拿下国产第1名,与 Qwen2-VL 先后出现在榜单上。


两个权威榜单的国产第一。


阶跃终于摘星辰 ????????????


资料链接 ✦✦


⋙ LiveBench 最新榜单:阶跃星辰位列中国大模型第一 @阶跃星辰


⋙ LMSYS 最新排名:阶跃星辰 Step-1V 多模态理解大模型位列中国第一 @阶跃星辰



阶跃太低调了。


以至于,昨天听阶跃工程师分享才意识到,原来阶跃已经有这么多模型了原来「繁星计划」已经诞生了这么多优秀的AI产品


掌声送给做实事的人 ????????????


资料链接 ✦✦


阶跃星辰 ● 官网链接 → https://www.stepfun.com


阶跃星辰 ● 开放平台 → https://platform.stepfun.com


常用榜单小结


这期专题日报 有各榜单的详细介绍,感兴趣可以前往阅读。


周刊就简单列一下平时参考最多的榜单 ????


权威测评排行榜


  • Chatbot Arena (LMSYS) :https://lmarena.ai/?leaderboard
  • LiveBench:https://livebench.ai
  • Open LLM Leaderboard:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
  • CompassRank 司南:https://rank.opencompass.org.cn


价格排行榜 (持续更新中的)


  • Artificial Analysis:https://artificialanalysis.ai
  • LLM Pricing:https://llm-price.com
  • Cloud LLM:https://docs.google.com/spreadsheets/d/1foc98Jtbi0-GUsNySddvL0b2a7EuVQw8MoaQlWaDT-w


有意思的排行榜


  • Artificial Analysis 文生图:https://artificialanalysis.ai/text-to-image/arena
  • Artificial Analysis 文生视频:https://artificialanalysis.ai/text-to-video/arena
  • Artificial Analysis 文本转语音:https://artificialanalysis.ai/text-to-speech/arena
  • The Fastest AI:https://thefastest.ai
  • TRACKING AI:https://trackingai.org/IQ


讨论交流 ✦✦


大模型测评和榜单的「内幕」


如果你想了解大模型测评「刷榜作弊」的实现细节,或者测评集滞后与泡沫化给大模型工程团队带来的困扰,可以看看下面两篇文章。


第1篇是 CoT Hub 测评集构建者的访谈,第2篇是零一万物技术专家的分享。


⋙ 大语言模型评测是怎么被玩儿烂的?我们跟知情人聊了一个下午


⋙ 关于大模型评测的 Yi 点思考|Young Genius


“最终,用户会用脚投票的。”


7.

举个栗子:当把「大模型开源」用「做饭吃饭」来解释,一起都豁然开朗起来 ⇨ 甚至还玩起了谐音梗



关于大模型的开源,我们最常听到的新闻有两类:① 开源-闭源未来谁更厉害,② 现在的大模型都是假开源。


周末群里闲聊时,A@社恐患者杨老师 以他极高的专业素养,用一连串比喻,科普了「大模型开源」到底怎么回事。


比如,开源预训练模型,相当于厨师从后厨给你端上来的菜;只开源权重,相当于只把菜给你端上来,让你吃饱。


再比如,开源后训练数据,相当于带你去厨房看整个厨师炒菜摆盘的过程;开源预训练数据,相当于带你去食材的源产地选品。


还有,开源,相当于进餐馆随便吃还可以打包;闭源,相当于按饭量计费而且不允许打包。


还有很多「做饭-吃饭」的精妙比喻,非常生动形象,可以看全文了解详情 ↓↓↓


资料链接 ✦✦


⋙ 有文化就是不一样...「另类理解」大模型术语 @赛博禅心


下笨功夫,做有心人。模型训练和开餐馆是一样的道理,没有难不难,只有想不想。by社恐患者杨老师


讨论交流 ✦✦


然后呢!群里出现了衍生玩法。


既然 LLM 是一个餐厅,那总得有菜谱吧:


你进了一家叫 302 的餐厅,打开了智谱,点了俩豆包,一碗商汤…


来盘海螺,来杯即梦,服务员叫 Jina,旁边吟游诗人唱着十四行诗


这篇是集大成者,很多梗让人拍案叫绝 ???? ⋙ 当我把所有AI应用放在一起。。。有趣的事情发生了!@AI大同学


8.

很有共鸣:为什么大部分人用不起来 AI?可能还没体验到效率飞升的 Aha Moment (顿悟时刻)


@Maker毕 这篇文章,引出了一个大家都很有共鸣的现象:大家都在谈AI,都觉得AI很重要,可是真正把AI变成工作伙伴的人凤毛麟角


大部分人使用AI的时候:


  • 要么完全忘记了还有AI这个选项
  • 要么不知道AI能做什么
  • 要么觉得用AI比直接做更麻烦


就算知道可以用 AI,还要面临一系列的心智负担:


  • 打开一个新的网页或软件
  • 思考如何描述自己的需求
  • 担心AI会不会理解错误
  • 检查AI的输出是否可靠
  • 要把结果复制粘贴回工作界面


这些步骤每一个看起来都很简单,但是加在一起就会让人不自觉地想:算了,还是自己来做吧。


资料链接 ✦✦


⋙ 为什么大部分人用不起来 AI?从被动到主动的范式转换 @ Maker毕


讨论交流 ✦✦


为什么会这样呢?


作者原文从产品交互范式的角度进行了解释。群友们的讨论视角更丰富和生动,分享一下~


????‍♀ 我感觉这个确实是。因为有些事情做久了之后就是纯经验型的,对于那种不是经常总结复盘的人,很难把它描述清楚,就像有些人对待实习生的态度一样,觉得不如自己做,这是其一。


其二是对AI的能力了解不够,因为用的不多,不知道AI在我的工作链条里能够提升我90%效率的部分是哪些,什么工作给它做好什么工作自己做好。


????‍♀ 以往的工具的使用已经让很多人产生了技术厌恶心理,要花很多时间学习工具、积累经验才能让它起到一点点释放人的主体性的作用。


????‍♀ 破解之道就是硬着头皮先用用再说。一定要有耐心,抱着了解未来趋势,提高自己效率解放生产力的决心去用。


一次两次给不了你想要的,第三次你就知道往哪个方向说更好了,也知道自己想要的效果需要通过哪几个层次和标准去约束。


花太多时间去push ai做ai不擅长的事情,发现这个环节自己做最方便,就把适合ai做和适合人做的事情分开了。


????‍♀ 体验一回效率提升就放不下了。


9.

集体讨论:大家都是怎么快速处理长视频、长音频、长文本材料的?都有哪些工作流和工具的配合应用?



话题发起者自己的经验:


1. 找到音频或视频的链接,可以是播客、b站等。


2. 用 cococut Chrome 插件下载视频,打开通义 直接上传视频或复制链接,用AI进行解析后可以快速浏览大纲、生成脑图和PPT,还能提取转录后的全部文本。


3. 将文本复制到 txt 文档里并上传给 kimi,用提前准备好的提示词进行解析,细致整理,针对性学习。


P.S. 如果是在线文章,可以用 sider 侧边栏之类的工具,边看边提问,帮助自己理解。


????‍???? 肉眼多看两遍,不用搞这么麻烦。


你一天里看到的信息里,有 1% 值得笔记记录就谢天谢地。


????‍???? 你用AI听播客的效果咋样?吸收知识变容易了吗?


????‍♀️ 效率提升了,不过还是得再听一遍。因为重点只有自己知道。让我觉得意外的,才是对我有信息增量的,才是对我价值。这个痛点真不容易解决。


所有的总结类产品都有类似的问题。AI的「重点」不一定是我的「重点」。


????‍???? 思考过程说不定还得写一遍。写一次才算是「编码」进脑子。


????‍???? 是的,写一遍,做一遍,才有心得和体会。感觉越是这个时候,能静下心逐字逐句阅读的能力反而很稀缺。


????‍???? 快速判断内容质量。


一般的就丢弃。还不错的,记录下有收获的要点,发评论区或者发群里。


特别好的,反复听,写笔记。特别特别好的,拓展成一个专题,补充更多资料,把这个话题了解得更深入一点。


????‍???? 快速判断内容质量 +1,越发觉得这个能力重要。


AI生成的一大堆内容中,可能也就 5% 是能启发到你的精华。能不能迅速捕捉 5% 扔掉别的 95%,很重要。


如果对付AI生成的内容有这个能力,那么,对付别人写的长文,第一眼质量判断还是自己来做吧。捕捉了一点儿精华后,可以让AI陪着深入。


 ????‍♂️ AI现在生成的东西大多都是重蹈覆辙。


现在看多了AI生成内容多了,还是更喜欢看一些带有人类固有表达的内容。那种人与人之间的会意还是挺美妙的。


????‍???? 目前我的体会是,如果AI生成的内容,我不能一眼验证真假对错,那我不会用的。


所以在翻译、分类和代码生成任务里,它确实可以帮助我节省很多精力(以至于有时间摸鱼和思考更 high level 的事情)。另外一方面,AI的训练和推理的一些范式,也可以反向启发人的思考和学习。


比如说tfm的预训练,需要自回归,知识才能记忆的稳定,那么人也不要排斥背诵,在学新东西的时候,也要保持观点输出,和别人的观点对齐。