前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >利用混元大模型零代码搭建自己的AI新闻总结工具

利用混元大模型零代码搭建自己的AI新闻总结工具

原创
作者头像
算法一只狗
修改2024-01-31 14:55:30
1470
修改2024-01-31 14:55:30
举报
文章被收录于专栏:算法一只狗算法一只狗

腾讯的混元大模型在10月份已经宣布了,其代码能力有较大幅度的提升,并且提升幅度超过 20%,而其代码处理效果在实测中高于ChatGPT 6.34%。混元大模型还支持了python,c++,java等多种常用编程语言,可以让普通用户依据自己的需求选择自己的编程语言。

这一波的升级可谓是重大。因此作为大模型白嫖党的我,本着不用白不用的原则,测试了一下混元大模型的能力。

AI新闻爬虫

作为一个AI从业者,本质上每天就想知道AI届发生了什么大的新闻。那么有没有可能,我们利用大模型的能力,帮我们制作一个爬虫工具,然后帮我们总结好新闻内容呢?

想到这里,要自己实现也是比较简单,分为以下几个步骤:

  • 安装selenium工具:这个工具主要是为了帮我们获取网页中的信息
  • 确定需要获取的网站内容:确定我们需要爬取哪个网站
  • 内容总结:这里可以调用任意一个现成的模型帮助我们进行总结

现在我们有了大模型之后,“分析网站”和“内容总结”这两个步骤就可以帮我们实现了。

1.安装Selenium进行网页内容爬取

安装selenium
代码语言:javascript
复制
pip install selenium
配置环境

(1)查看对应Chrome版本:

打开谷歌浏览器:浏览器输入地址

代码语言:javascript
复制
chrome://version/

可以看到,版本号为12.0.6167.85

(2)下载Chrome谷歌浏览器对应版本的驱动: Chrome Drive

chromedriver下载网址: https://googlechromelabs.github.io/chrome-for-testing/

选择版本为12.0.6167.85:

解压后得到文件:chromedriver.exe,并把该文件放到python3中的Scripts中:

启动Selenium命令

利用chrome浏览器内核,就可以不启动浏览器窗口也可以登陆网站

2.分析网站内容

这里主要爬取:https://dataconomy.com/category/topics/data-science/artificial-intelligence/

比如我们点击上面网页的《tiktok wants to know》这篇文章的内容,然后F12打开开发者工具,发现需要爬取的内容包裹在了:div.content-inner

因此我们可以询问混元大模型,怎么基于这个网页进行爬取:

跑一下结果,可以看到,网页的内容已经基本获取到了:

现在网页内容是很多,但是我不想看了,因此需要它帮我进行总结,那么也可以问混元大模型怎么进行中文总结。由于本身我已经申请了chatgpt的账号,因此很简单的就可以调用这个接口进行回答。

可以看到,利用上面代码后,就可以总结处自己想要的中文内容了:

得到了上面的爬虫工具后,就可以每天自动总结新闻,然后生成一份数据。

这样可玩性就可以大大增加,可以和微信或者公众号进行联动,媒体发送一份总结好的新闻给自己,这样就可以省去很多时间了。

总结

从上面的流程来看,基本不需要自己写一行代码,只需要把自己的需求反馈给混元大模型,大部分的时候都可以解决。

而且从测试效果看,有时候混元大模型不仅仅给出代码,还会详细介绍每一个参数,包括一些参看网址,这样就能够很好的查询消息是否准确。

相信假以时日,混元大模型会不断加强,使得普通人也能够很好的上手编程。

以上就是本期的所有内容了,我是leo,我们下期再见~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • AI新闻爬虫
    • 1.安装Selenium进行网页内容爬取
      • 2.分析网站内容
      • 总结
      相关产品与服务
      腾讯混元大模型
      腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
      http://www.vxiaotou.com