人工智能集合

本项目以应用为主出发，结合了从基础的机器学习、深度学习到目标检测以及目前最新的大模型，采用目前成熟的第三方库、开源预训练模型以及相关论文的最新技术，目的是记录学习的过程同时也进行分享以供更多人可以直接进行使用。

本人自己目前属于自己创业，目前要时围绕各类算法场景的应用开发，目前主要的领域为船舶、教育以及企业定制的开发

一、目录

对应每个案例将采用独立的文件夹的方式进行管理，非源码的可以参考对应的文档进行相关依赖的安装，部分存在源码的则可以通过源码中对应的requirements.txt安装对应的依赖。

TTS解决方案
ASR解决方案
图片特征提取

机器学习基础

基于numpy实现的机器学习算法: 主要是讲述底层的算法的逻辑，实际使用中往往采用第三方库来实现
基于sklearn的机器学习算法: 主要是讲述如何使用第三方类库快速使用成熟的算法
预处理技术: 其主要包含针对机器学习工程中针对数据的预处理的部分的算法
特征工程: 主要是围绕各类数据分析场景下针对数据的特征表示的算法

数据挖掘

挖掘频繁项集: 主要是采用numpy与sklearn的方式实现这类算法

TTS解决方案

Kokore适合边缘设备的TTS解决方案

ASR解决方案

基于faster-whisper的实时音频处理

图片特征提取

SigLIP 图文对照模型: 大量的多模态模型的图像特种提取必使用的模型，本文档基于目前主流的siglip-so400m-patch14-384模型进行编写，开发多模态大模型必须掌握的图像特征提取库
InternVideo2 多模态视频理解模型: 由于上海人工智能实验室（General Vision Team of Shanghai AI Laboratory）推出的针对视频理解的模型，目前针对视频理解的论文逐渐将其作为融合siglip来实现针对视频&图片场景的多模态大模型的基础组件

目标检测技术

其他技术

Spark ML的使用方式: 目前该技术的应用场景逐步减少，本教程也是基于较老的版本进行编写，读者需要根据自己的使用以及目前最新的文档结合进行对应的API调整。

—————— 以下为未重构的老版本 ————————

二、文档目录

2.1 目标检测相关 (cnn)

正态分布

可使用numpy.random中的randn、standard_normal和normal返回随机正态分布的数组，其中normal是普遍使用的方法。

其他算法与工具

扩展算法

黎曼和估算与面积法

指标

即衡量目标的单位或方法，这里我们列举几个在互联网中比较常见的指标进行说明：

PV：页面浏览树数，即每天的点击数。
UV：独立用户数，即每天每个用户的浏览数。
DAU：日活跃用户数，即每天活跃的用户数量。

当然指标不仅仅只有上面还有MAU、LTV和ARPU等，每个指标都要满足以下几点：

数字化
易衡量
意义清晰
周期适当
尽量客观

Name		Name	Last commit message	Last commit date
Latest commit History 127 Commits
cv2		cv2
data		data
detr		detr
docs		docs
email		email
facerecognition		facerecognition
featureengineering		featureengineering
frequentItemsets		frequentItemsets
internvideo		internvideo
kokoro		kokoro
media		media
normal		normal
numpy		numpy
preprocessing		preprocessing
scipy		scipy
siglip		siglip
sklearn		sklearn
spark		spark
voice/whisper		voice/whisper
yolo		yolo
.gitignore		.gitignore
ReadMe.md		ReadMe.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

人工智能集合

一、目录

机器学习基础

数据挖掘

TTS解决方案

ASR解决方案

图片特征提取

目标检测技术

其他技术

二、文档目录

2.1 目标检测相关 (cnn)

2.3 LLM大模型相关

2.4 机器学习基础

2.5 机器人基础

数据基础知识

正态分布

其他算法与工具

扩展算法

指标

依赖工具

About

Releases

Packages

Languages

OrvilleX/MachineLearning

Folders and files

Latest commit

History

Repository files navigation

人工智能集合

一、目录

机器学习基础

数据挖掘

TTS解决方案

ASR解决方案

图片特征提取

目标检测技术

其他技术

二、文档目录

2.1 目标检测相关 (cnn)

2.3 LLM大模型相关

2.4 机器学习基础

2.5 机器人基础

数据基础知识

正态分布

其他算法与工具

扩展算法

指标

依赖工具

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages