分类 科技 下的文章

提问词:“请解释一下生成式AI”
一下回答来自DeepSeek,版权归DeepSeek机器人!

好的,这是一个关于“生成式AI”的详细解释,从基本概念到核心原理、应用和挑战,力求全面且易懂。


一、 核心概念:什么是生成式AI?

简单来说,生成式AI是一种能够创造全新内容的人工智能

我们可以通过与另一种更常见的AI进行对比来理解它:

  • 判别式AI:它的核心任务是 “区分”“判断” 。它学习数据中的规律,然后对已有的信息进行分类或预测。

    • 例子:识别照片中的猫狗、判断邮件是否为垃圾邮件、预测房价。它会回答:“这是一只猫。” 或者 “这封邮件有90%的可能是垃圾邮件。”
  • 生成式AI:它的核心任务是 “创造”“生成” 。它学习数据中的分布和模式,然后创造出全新的、与训练数据相似但又不完全相同的内容。

    • 例子:根据文字描述画出一只从未存在过的猫、写一首诗、创作一段音乐。它会根据你的指令,生成一幅《一只戴着宇航员头盔的猫在月球上钓鱼》的图像。

一个生动的比喻:

  • 判别式AI 像一个艺术鉴定师,他能判断一幅画是真迹还是赝品,属于哪个流派。
  • 生成式AI 像一个艺术家,他能学习毕加索、梵高等大师的风格,然后创作出一幅全新的、具有大师风范的画作。

二、 它是如何工作的?核心技术原理

生成式AI的爆发主要归功于几种关键的机器学习模型,尤其是生成对抗网络大型语言模型

  1. 生成对抗网络 - GANs

    • 核心思想:让两个神经网络相互博弈、共同进步,就像一个伪造者和一个警察。

      • 生成器:负责制造“假货”(如图像)。它的目标是生成足以以假乱真的数据,骗过判别器。
      • 判别器:负责鉴定“真伪”。它的目标是尽可能准确地判断输入数据是来自真实数据集还是生成器的伪造品。
    • 过程:两者不断对抗训练。生成器变得越来越擅长伪造,判别器也越来越擅长鉴别。最终,生成器能创造出极其逼真的内容。
  2. Transformer模型与大型语言模型 - LLMs

    • 这是驱动ChatGPT、文心一言等聊天机器人的核心技术。
    • 核心能力理解并生成自然语言
    • 工作原理

      • 海量数据训练:在数以亿计的网页、书籍、文章等文本数据上进行训练。
      • 学习语言规律:模型通过学习,掌握了语法、句法、事实知识以及语言的统计规律(即“哪个词接下来出现的概率最高”)。
      • 生成内容:当你给出一个提示时,模型会根据学到的规律,一个字一个字地预测最可能的下一个词,从而生成连贯、有逻辑的文本。它不是在数据库中搜索答案,而是“计算”出最合理的回答。
  3. 扩散模型

    • 这是当前AI绘画(如Midjourney, Stable Diffusion)领域的主流技术。
    • 核心思想:像一个“去噪”的过程。

      • 前向过程:对一张真实图片逐步添加噪声,直到它变成完全无意义的随机噪点。
      • 反向过程:训练模型学习如何从纯粹的噪点中,一步步地“去除”噪声,最终还原出一张清晰的图片。
    • 生成内容:当你想生成一张新图片时,模型就从一张随机噪点开始,根据你的文字描述,一步步执行去噪过程,最终“构造”出一张符合描述的、全新的图片。

三、 生成式AI的主要应用领域

生成式AI的应用已经渗透到各个行业:

  • 文本生成:撰写邮件、报告、广告文案、小说、诗歌;编写和调试代码。
  • 图像生成:根据文字描述创作艺术画、设计logo、生成营销素材、进行照片修复和增强。
  • 音频生成:创作音乐、模拟人声(语音合成)、为视频自动配音。
  • 视频生成:创建动画、生成短视频、进行视频剪辑和特效处理。
  • 跨模态理解与生成:将一种形式的信息转换为另一种形式,例如:文生图(DALL-E)、图生文(为图片生成描述)、语音转文字等。
  • 科学与医药:生成新的分子结构用于药物发现、设计蛋白质序列。

四、 面临的挑战与风险

尽管潜力巨大,生成式AI也带来了诸多挑战:

  • 事实性与“幻觉”:模型可能会生成听起来合理但完全是编造的内容,这被称为“幻觉”。它不是一个知识库,而是一个“概率模型”,因此不能完全信任其输出的事实准确性。
  • 偏见与公平性:模型从互联网数据中学习,可能会继承并放大其中存在的社会偏见(如种族、性别偏见)。
  • 滥用与安全:可能被用于制造和传播虚假信息(深度伪造)、进行网络诈骗、生成恶意代码等。
  • 版权与所有权:AI生成内容的版权归属问题尚不明确——它属于提供提示的用户、模型开发者,还是被用于训练数据的原始创作者?
  • 能源消耗:训练和运行大型生成式AI模型需要巨大的计算资源,消耗大量能源。

总结

生成式AI是一次范式转变,它让机器从被动的分析工具,变成了主动的创造伙伴。 它不再仅仅是“理解”世界,而是开始“模拟”和“扩展”世界。理解其工作原理、能力和局限性,对于在未来如何有效、负责任地使用这项技术至关重要。

今天六一儿童节,自己在家里整理电脑。除了C、D盘符外,设备管理器中有一些不要的盘符,有点碍眼。找遍全网找到了解决方案,Happy!
Windows系统下删除“我的电脑”界面中,“设备和驱动器”里不要的盘符,如360云盘、微云、坚果云等。
直接上干货:
/////////
Win + R, 运行 regedit
按照路径点开 HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\Mycomputer\NameSpace
路径同样找 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\MyComputer\NameSpace\

两个路径下删除不需要的文件,刷新一下我的电脑界面,不想保留的图标就不见了。
/////////

字节跳动旗下的美国公司产品TikTok,拜登为总统期间的美国政府要禁止TikTok,期间也是不断地给字节跳动施压。最为戏曲性的是禁令的时间到2025年1月19日截止,而这正是拜登总统的最后一天任期。新的美国总统特朗普将于2025年1月20日上任就职,就在他上任的前一天,1月19日TikTok还被关了数小时,因为特朗照停,停止服务很短的时间后又重启。但目前这仅仅是在运行,接下来TikTok的命运如何还未知。也就在这个时间节点的前几天,小红书Rednote成了很多TikTok用户的避难所。
我记得几年前刚开始接触互联网时,曾经记录过独立博客(或者个人独立存储)的重要性,独立博客不会因为公共服务商的离开而丢失数据和自己在互联网上的记忆。其实很多经典的互联网关停停,很多记录和记忆不能及时的保存就丢失了。记忆中以前有网易相册、人人网、博客中国,腾讯微博......现在TikTok也面临同样的可能被禁而关停的遭遇。虽然我不在国外,没有使用TikTok,但这件事让我回想起曾经的记忆。zyyzw这个博客,从现存档的记录是从2015年7月,到目前有近10个年头了,没有轰轰烈烈的流量,也没有成为网红,只是记录自己生活和成长的一个载体。10年间断腾过VPS,虚拟主机,云主机,花了心思花了Money,青春无悔,记忆陪伴。让我们继续坚持,继续坚守!
The END.

焦急的更新论文的参考文献,Endnote的pubmed总是链接不上,很少郁闷。
解决方法如下:

Endnote链接pubmed报错12507:不能连接到吊销服务器
Windows error:12057.Message:"不能连接到吊销服务器,或者未能获得最终响应。"。

如果遇到这样的情况,不妨可以试试以下方法:
以win10为例,打开【设置】搜索【控制面板】,打开后点【Internet选项】。
选择【Internet选项】中的【高级】,并将【使用TLS1.0/1.1/1.2】全选中(勾上)。
然后,取消勾选以下两项:(注意:是取消!!!)
·检查发行商的证书是否已吊销(取消勾选);·检查服务器证书是否已吊销(取消勾选);
随后,点击【确定】。
点击【确定】后,重启电脑,重启endnote。然后,点击【PubMed(NLM)】,显示连接【Connecting to Host…】。
等待5~10s后,就能显示连接上,可以正常使用啦!

科研工作者会用到!加油!

有时候需要从Github下载一些学习资料,但是打开很慢,甚至有时候完全打不开。寻遍互联网,找到一些国内可访问的镜像,分享给大家。

Github镜像
网址一:https://hub.nuaa.cf/
网站二:https://gitclone.com/

GitHub下载文件加速
利用 Cloudflare Workers 对 github release 、archive 以及项目文件进行加速,部署无需服务器且自带CDN.
网址一:https://gh.api.99988866.xyz
网址二:https://ghproxy.com/
网址三:http://toolwa.com/github/(输入GitHub链接即可)

请大家自行仔细研究登录。

自己验证的网址可用 https://hub.nuaa.cf/flatpressblog