Skip to content

本项目以应用为主出发,结合了从基础的机器学习、深度学习到目标检测以及目前最新的大模型,采用目前成熟的 第三方库、开源预训练模型以及相关论文的最新技术,目的是记录学习的过程同时也进行分享以供更多人可以直接进行使用。

Notifications You must be signed in to change notification settings

OrvilleX/MachineLearning

Repository files navigation

人工智能集合

本项目以应用为主出发,结合了从基础的机器学习、深度学习到目标检测以及目前最新的大模型,采用目前成熟的 第三方库、开源预训练模型以及相关论文的最新技术,目的是记录学习的过程同时也进行分享以供更多人可以直接 进行使用。

本人自己目前属于自己创业,目前要时围绕各类算法场景的应用开发,目前主要的领域为船舶、教育以及企业定制的开发

一、目录

对应每个案例将采用独立的文件夹的方式进行管理,非源码的可以参考对应的文档进行相关依赖的安装,部分存在源码的则可以 通过源码中对应的requirements.txt安装对应的依赖。

机器学习基础

数据挖掘

TTS解决方案

ASR解决方案

图片特征提取

  • SigLIP 图文对照模型: 大量的多模态模型的图像特种提取必使用的模型,本文档基于目前主流的siglip-so400m-patch14-384模型进行编写,开发多模态大模型必须掌握的图像特征提取库

  • InternVideo2 多模态视频理解模型: 由于上海人工智能实验室(General Vision Team of Shanghai AI Laboratory)推出的针对视频理解的模型,目前针对视频理解的论文逐渐将其作为融合siglip来实现针对视频&图片场景的多模态大模型的基础组件

目标检测技术

其他技术

  • Spark ML的使用方式: 目前该技术的应用场景逐步减少,本教程也是基于较老的版本进行编写,读者需要根据自己的使用 以及目前最新的文档结合进行对应的API调整。

—————— 以下为未重构的老版本 ————————

二、文档目录

2.1 目标检测相关 (cnn)

2.3 LLM大模型相关

2.4 机器学习基础

2.5 机器人基础

数据基础知识

正态分布

可使用numpy.random中的randn、standard_normal和normal返回随机正态分布的数组,其 中normal普遍使用的方法。

其他算法与工具

扩展算法

  1. 黎曼和估算与面积法

指标

即衡量目标的单位或方法,这里我们列举几个在互联网中比较常见的指标进行说明:

  1. PV:页面浏览树数,即每天的点击数。
  2. UV:独立用户数,即每天每个用户的浏览数。
  3. DAU:日活跃用户数,即每天活跃的用户数量。

当然指标不仅仅只有上面还有MAULTVARPU等,每个指标都要满足以下几点:

  • 数字化
  • 易衡量
  • 意义清晰
  • 周期适当
  • 尽量客观

依赖工具

  1. matplotlib可视化
  2. 训练模型持久化
  3. Sklearn中文文档
  4. 将模型持久化为PMML供Java应用运行
  5. Java运行PMML模型算法

About

本项目以应用为主出发,结合了从基础的机器学习、深度学习到目标检测以及目前最新的大模型,采用目前成熟的 第三方库、开源预训练模型以及相关论文的最新技术,目的是记录学习的过程同时也进行分享以供更多人可以直接进行使用。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published