DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
原创博客

原创AI技术博客

探索人工智能与大模型最新资讯与技术博客,涵盖机器学习、深度学习、自然语言处理等领域的原创技术文章与实践案例。

排序方式
按日期排序按浏览量排序
常用的SQL语句总结

常用的SQL语句总结

平时很多时候需要用到SQL,一些常见常用的SQL语句总结,后面可以拷贝使用

2022/04/15 23:15:491,103
#SQL#编程
截至2022年4月份全球大语言模型一览图

截至2022年4月份全球大语言模型一览图

Alan D Thompson博士总结的,截至2022年4月份全球大语言模型一览图。

2022/04/12 09:35:021,501
#好物推荐
正则化和数据增强对模型的影响并不总是好的:The Effects of Regularization and Data Augmentation are Class Dependent

正则化和数据增强对模型的影响并不总是好的:The Effects of Regularization and Data Augmentation are Class Dependent

正则化是一种基本技术,通过限制模型的复杂性来防止过度拟合并提高泛化性能。目前的深度网络严重依赖正则化器,如数据增强(DA)或权重衰减,并采用结构风险最小化,即交叉验证,以选择最佳的正则化超参数。然而,正则化和数据增强对模型的影响也不一定总是好的。来自Meta AI研究人员最新的论文发现,正则化是否有效与类别高度相关。

2022/04/11 22:52:181,581
#论文快讯
Python800页免费电子书——Python基本库和著名经典库的使用

Python800页免费电子书——Python基本库和著名经典库的使用

《Python Notes For Professionals》是StackOverflow上的人总结的Python使用方法。

2022/04/11 15:55:551,315
#python
最近一段时间深度学习大模型的重要进展(2022年4月初)

最近一段时间深度学习大模型的重要进展(2022年4月初)

今晚已经是本周的最后一天了,最近的一些深度学习算法方面的进展做个总结吧,感觉都是挺不错的,供大家参考。

2022/04/10 23:34:551,571
#论文快讯
使用Jupyter Notebook编程与python脚本编程的差异

使用Jupyter Notebook编程与python脚本编程的差异

Jupyter Notebook虽然在教学等领域有着非常大的优势,但是实际编程中,它的效率、可维护性等方面与python脚本相比的差距到底在哪也一直不那么清晰。就在上个月底,JetBrains的研究人员使用了大量的数据详细对比了二者的差异。这里总结一下其主要结论。

2022/04/10 22:40:352,313
#Jupyter#编程
Python生态系统中5个NLP工具库

Python生态系统中5个NLP工具库

Python是目前最流行的编程语言,也是开放生态做得最好的编程语言之一。大多数深度学习框架、机器学习的框架都有很优秀的Python版本。这篇博客主要为大家介绍5个python生态系中解决NLP任务的框架。

2022/04/10 20:23:132,341
#NLP#工具
OpenAI第二代DALL·E发布,可以使用自然语言创造和编辑图片的模型

OpenAI第二代DALL·E发布,可以使用自然语言创造和编辑图片的模型

今天,时隔一年后,OpenAI发布了第二代的DALL·E模型。相比较第一代的模型,DALL·E 2,以4倍的分辨率生成更真实和准确的图像。

2022/04/06 23:25:383,123
#OpenAI#语言模型
Google最新超大模型Pathways:一个会讲笑话的6400亿参数的语言模型

Google最新超大模型Pathways:一个会讲笑话的6400亿参数的语言模型

今天,Google介绍了一个新的语言模型,一个Pathways语言模型:PaLM,这是一个用Pathways系统训练的5400亿个参数、仅有dense decoder的Transformer模型,在数百个语言理解和生成任务上对PaLM进行了评估,发现它在大多数任务中实现了最先进的性能,在许多情况下都有显著的优势。

2022/04/05 11:13:041,469
#论文快讯#语言模型
大型语言模型的新扩展规律(DeepMind新论文)——Training Compute-Optimal Large Language Models

大型语言模型的新扩展规律(DeepMind新论文)——Training Compute-Optimal Large Language Models

3月29日,DeepMind发表了一篇论文,"Training Compute-Optimal Large Language Models",表明基本上每个人--OpenAI、DeepMind、微软等--都在用极不理想的计算方式训练大型语言模型。论文认为这些模型对计算的使用一直处于非常不理想的状态。并提出了新的模型缩放规律。

2022/04/04 13:14:092,975
#deepmind#论文快讯
新的对话式语言模型可以将自然语言转换成可执行代码!

新的对话式语言模型可以将自然语言转换成可执行代码!

2022/04/03 14:30:111,669
#论文快讯
Copilot Labs插件——基于AI的代码解释和代码翻译神器

Copilot Labs插件——基于AI的代码解释和代码翻译神器

昨天,Copilot团队推出了一个名为GitHub Copilot Labs的VS Code配套扩展。它独立于(并依赖于)GitHub Copilot扩展。它可以用来解释代码和翻译代码。

2022/04/01 09:39:037,194
#copilot#GitHub
2022年了,Java和Java的生态怎么样了?

2022年了,Java和Java的生态怎么样了?

不久前,Java18发布,至此这款编程语言已经走过三十多年。随着近几年深度学习的发展,python已经开始霸榜编程语言,Java的流行度似乎下降很多。那么,如今的Java到底是什么状态,未来它的方向在哪?近期,JRebel对中大型企业技术人员的访谈,给我们一些指引和回答。

2022/03/31 22:13:141,279
#Java#报告
Deep Neural Networks and Tabular Data: A Survey——XGBoost依然是最优秀的算法模型

Deep Neural Networks and Tabular Data: A Survey——XGBoost依然是最优秀的算法模型

异质表格数据是最常用的数据形式,对于众多关键和计算要求高的应用来说是必不可少的。在同质数据集上,深度神经网络已多次显示出优异的性能,因此被广泛采用。然而,它们在表格数据建模(推理或生成)方面的应用仍然具有高度挑战性。

2022/03/31 12:15:192,014
#论文快讯
重磅!大规模预训练模型路线图

重磅!大规模预训练模型路线图

重磅新论文!北京人工智能研究员与清华大学、腾讯、华为、字节等公司一起发表了一篇关于大规模预训练模型路线图的论文。

2022/03/30 09:14:201,690
#论文快讯
一个非常有趣的数据工程师小游戏

一个非常有趣的数据工程师小游戏

Firebolt开发了一个数据工程师的网页小游戏,带你体验数据分析的全流程。游戏里你扮演一个数据工程师,从数据收集开始,经历数据pipeline、数据入数据湖以及数据分析等,最终形成各种图表的结果。

2022/03/29 10:02:562,004
#好物推荐
2022年欧洲增长速度最快的公司(上)

2022年欧洲增长速度最快的公司(上)

FT1000是金融时报评选的欧洲增长速度最快的前1000个公司,这个名单可以看出来过去几年欧洲哪些企业增长较快,它们在哪些行业经营等。2022年的榜单也刚刚发布,让我们一睹为快。

2022/03/28 22:30:292,239
#企业简介
深度学习9个小时内教会机器人拿起和剥开香蕉

深度学习9个小时内教会机器人拿起和剥开香蕉

仅仅使用来自人类数据集的机器学习,在短短9个小时内,日本研究人员让一个机器人学会了如何拿起和剥开香蕉。

2022/03/28 09:10:391,162
#论文快讯
2022年程序员必备的网站收藏

2022年程序员必备的网站收藏

大家都知道,编程的开发离不开互联网的支持,不管是编程的学习还是bug的修复,都需要社区和外部的支持。因此,我们全新开通了一个程序必备网站列表栏目,为大家提供一站式访问目录。也欢迎评论,大家可以说一下你们写代码时候喜欢用的网站,我们也会更新上去。在这里我们挑选几个必备网站简单介绍一下。

2022/03/27 21:55:191,573
#好物推荐#网站导航
Anubis——纽约大学计算机学生建立的学习管理系统和CloudIDE简介

Anubis——纽约大学计算机学生建立的学习管理系统和CloudIDE简介

Anubis是一个分布式LMS(学习管理系统),由John Cunniff创建,专门为CS课程的自动化而设计。Anubis已经在纽约大学坦登分校使用并经过了几个学期的测试。这个系统的主要目的是自动为提交的作业评分,并提供了一个云IDE解决方案,以简化学生的体验。

2022/03/27 20:28:551,680
#好物推荐
全球最大的39亿参数的text-to-image预训练模型发布

全球最大的39亿参数的text-to-image预训练模型发布

CVPR2022的一篇论文带来了一个39亿参数的自回归图像模型公开了他们的代码和论文。

2022/03/26 16:26:151,307
#论文
2022年全球最大的10家数据处理相关的创业公司

2022年全球最大的10家数据处理相关的创业公司

最近几年,数据的重要性在各个领域都获得了巨大的重视。因此,数据管理相关的业务也成为各项基础设施中增长最快的业务,目前的市场规模约700亿美元,占所有企业的基础设施支持约1/5。仅在2021年,数据处理相关的公司获得了数百亿的风险投资。为此,Future总结了2022年全球最大的50家数据创业企业。这里我们列举其中的最大的10个进行介绍。

2022/03/26 00:18:524,025
#人工智能#企业简介
重磅数据集分享:大规模多模态语料库之悟道数据集(WuDaoCorpora 2.0)

重磅数据集分享:大规模多模态语料库之悟道数据集(WuDaoCorpora 2.0)

前几天,北京智源人工智能研究院引入了一个名为WuDaoMM的大规模多模态语料库,总共包含超过6.5亿对图像-文本。具体来说,约有6亿对数据是从图像和标题呈现弱相关的多个网页中收集的,另外5000万对强相关的图像-文本是从一些高质量的图片网站中收集的。

2022/03/24 09:17:395,141
#数据集
斯坦福2022年度AI指数报告简介及下载链接

斯坦福2022年度AI指数报告简介及下载链接

人工智能指数是斯坦福大学以人为本人工智能研究所(Stanford Institute for Human-Centered Artificial Intelligence (HAI))联合学术界、工业界的专家一起发布的人工智能相关的发展报告。2022年度AI指数报告在近几日发布。

2022/03/20 23:10:211,830
#AI#人工智能
上一页
1...242526...40
下一页

专题合集

RAG(检索增强生成)Long Context 长上下文AI Agent 实践

最热博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

今日推荐

  • 突破英特尔CPU+英伟达GPU的大模型训练硬件组合:苹果与AMD都有新进展!
  • Java入门基础笔记-5
  • OpenAI最新的文本生成图像大模型DALL·E3发布!生成的图像不忽略每一个细节的文本!
  • OpenAI官方Prompt教程:如何让ChatGPT扮演不同角色,完成教学任务
  • 平衡二叉树(Balanced Binary Tree)
  • Meta即将推出开源的CodeLLaMA:一种新的编程AI模型
  • 使用sklearn做高斯混合聚类(Gaussian Mixture Model)
  • Python3.10版本的结构模式匹配(structural pattern matching)简介