一亩三分地

人工智能 K 均值聚类（K-means）
孟宝亮2024-02-14138900
聚类（Clustering）指的是将一组数据点按照某种规则或者方法分成多个组或簇，使得同一组内的数据点在某种意义上更相似，而不同组之间的数据点相对较不相似。聚类时，可以基于数据分布、基于数据密度、基...
GPT 模型发展脉络 GPT Store 正式上线
孟宝亮2024-01-1020400
ChatGPT 中的 GPT Store 面向所有 Plus 用户开放，支持搜索、收藏、创建专属 GPT。
GPT 模型发展脉络 GPT Store 内测上线
孟宝亮2023-12-0813700
自定义 GPT 的“GPT 商店”向部分用户开放测试。
GPT 模型发展脉络 GPT-4 Turbo 发布 + Dev Day 大会
孟宝亮2023-11-0622900
OpenAI 举办首届 Dev Day，发布 GPT-4 Turbo（128K 上下文），并引入“自定义 GPTs”、“工具调用”、“系统指令”等重大功能。
人工智能 Product Quantization（PQ）
孟宝亮2023-10-08224803
Product Quantization 是一种有效的近似最近邻搜索方法，具有较高的搜索效率和较低的内存消耗。该方法已被广泛应用于图像检索、文本检索和机器学习等领域。 PQ 将高维数据点分成多个子空间...
PYTHON Faiss 向量检索库
孟宝亮2023-10-06491705
Faiss（Facebook AI Similarity Search）是由 Facebook AI 团队开发的一个开源库，用于高效相似性搜索的库，特别适用于大规模向量数据集的存储与检索。 https...
人工智能《随机森林》（一）准备工作
孟宝亮2023-09-1940600
随机森林（Random Forest）是一种基于集成学习思想的监督学习算法，广泛用于分类和回归任务。随机森林在很多不同的领域表现出色，如金融市场预测、客户流失预测、医疗诊断等。它不仅在结构化数据集上表...
《随机森林》
人工智能《随机森林》（二）算法初探
孟宝亮2023-09-1848403
随机森林（Random Forest）能够用于分类和回归任务。通过两个应用案例来学习如何使用随机森林来解决分类和回归问题，以及算法的基本原理。 1. 算法使用 2. 基本原理随机森林通过构建多个决策...
《随机森林》
人工智能《随机森林》（三）算法细节
孟宝亮2023-09-1749300
对于随机森林算法而言，预测过程非常简单，易于理解。理解的重点是其如何训练多个基学习器来构建强学习器。 1. 有放回采样随机森林基于原始训练集通过有放回的采样（Bootstrap Sampling）产...
《随机森林》
人工智能《随机森林》（四）算法实现
孟宝亮2023-09-1646500
scikit-learn 提供了 RandomForestClassifier 和 RandomForestRegressor 两个随机森林的实现，用于分类和回归任务。为了能够更好的使用随机森林，我们...
《随机森林》
GPT 模型发展脉络 Code Interpreter 开放
孟宝亮2023-07-2015900
高级数据分析器（原 Code Interpreter）向 ChatGPT Plus 用户全面开放。
PYTHON Python 可变和不可变类型
孟宝亮2023-07-06166900
在 Python 中存在 int、str、float、bool 等基本数据类型，也存在 list、tuple、set、dict 这样的容器数据类型。这些数据类型被划分为可变（mutable）和不可变（...
人工智能补集朴素贝叶斯（Complement NB）
孟宝亮2023-06-27143900
Complement Naive Bayes (CNB) 是对多项式朴素贝叶斯 (Multinomial Naive Bayes, MNB) 的一种改进。它主要针对多项式朴素贝叶斯在处理类别不平衡问题...
PYTHON Python gRPC
孟宝亮2023-06-035801
Google gRPC（Google Remote Procedure Call）是一个高性能、开源的远程过程调用框架，它允许客户端直接调用远程服务器上的方法，就像调用本地方法一样，屏蔽了网络通信的复...
GPT 模型发展脉络 GPT-4 正式发布
孟宝亮2023-03-1421200
OpenAI 发布 GPT-4，多模态能力增强，支持图像输入（API 和研究预览）。