ludekcizinsky
diff --git a/‎examples/ffnn-iris/report/figures/training.png
2.87 KB b/‎examples/ffnn-iris/report/figures/training.png
2.87 KB
diff --git a/‎examples/ffnn-iris/report/report.html
+51-51 b/‎examples/ffnn-iris/report/report.html
+51-51
diff --git a/‎examples/linr-wine/main.py
+56 b/‎examples/linr-wine/main.py
+56
diff --git a/‎examples/linr-wine/report/figures/training.png
38 KB b/‎examples/linr-wine/report/figures/training.png
38 KB
diff --git a/‎examples/linr-wine/report/report.html
+72 b/‎examples/linr-wine/report/report.html
+72
diff --git a/‎nnlearn/linear/__init__.py
+5 b/‎nnlearn/linear/__init__.py
+5
diff --git a/‎nnlearn/linear/_linr.py
+103 b/‎nnlearn/linear/_linr.py
+103
diff --git a/‎nnlearn/metrics/_regression.py
+23-7 b/‎nnlearn/metrics/_regression.py
+23-7
diff --git a/‎nnlearn/nanograd/_nanograd.py
+3 b/‎nnlearn/nanograd/_nanograd.py
+3
diff --git a/‎nnlearn/network/_ffnn.py
+1-1 b/‎nnlearn/network/_ffnn.py
+1-1
@@ -0,0 +1,56 @@
+import os 
+import sys
+sys.path.insert(0, os.path.abspath('../..'))
+
+from nnlearn.linear import LinearRegression as LR
+from nnlearn.metrics import mean_squared_error
+from nnlearn.util import ScriptInformation
+
+# TODO: replace this with own implentation
+from sklearn import preprocessing
+from sklearn.model_selection import train_test_split
+from sklearn.datasets import load_wine
+
+def test_linr_regressor():
+    
+    logger = ScriptInformation()
+    logger.section_start(":grapes: Linear Regression - Wine data")
+    logger.script_time()
+    logger.author("Ludek", "Cizinsky")
+    logger.section_start(":construction: Prepare input for the model")
+
+    logger.working_on("Load and split data") 
+    X, y = load_wine(return_X_y=True)
+
+    logger.working_on("Train test split")
+    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
+    m = X_train.shape[1]
+
+    logger.working_on("Process the data")
+    scaler = preprocessing.StandardScaler().fit(X_train)
+    X_train = scaler.transform(X_train)
+    X_test = scaler.transform(X_test)
+
+    logger.section_start(":robot: Train the model")
+    figpath = "report/figures/"
+    clf = LR(optimizer='gd_backp',
+             epochs = 25,
+             loss_func='mse',
+             batch_size=.25,
+             lr=.15,
+             shuffle=True,
+             bias=True,
+             figpath=figpath)
+    clf.fit(X_train, y_train)
+    logger.c.print(clf.report)
+
+    logger.section_start(":crystal_ball: Validate the model")
+    y_hat = clf.predict(X_test)
+    mse = mean_squared_error(y_test, y_hat, var=False)
+    logger.important_metric('MSE', mse)
+
+    logger.save("report/report.html")
+
+if __name__ == '__main__':
+    test_linr_regressor()
+
@@ -0,0 +1,72 @@
+<!DOCTYPE html>
+<head>
+<meta charset="UTF-8">
+<style>
+.r1 {color: #31748f; text-decoration-color: #31748f; font-weight: bold}
+.r2 {color: #908caa; text-decoration-color: #908caa}
+.r3 {color: #008080; text-decoration-color: #008080; font-weight: bold}
+.r4 {color: #00ff00; text-decoration-color: #00ff00; font-weight: bold}
+.r5 {color: #9ccfd8; text-decoration-color: #9ccfd8}
+.r6 {color: #908caa; text-decoration-color: #908caa; font-weight: bold}
+.r7 {font-weight: bold}
+.r8 {font-weight: bold; text-decoration: underline}
+.r9 {color: #ebbcba; text-decoration-color: #ebbcba}
+.r10 {color: #eb6f92; text-decoration-color: #eb6f92}
+.r11 {color: #808000; text-decoration-color: #808000; font-weight: bold}
+.r12 {color: #0000ff; text-decoration-color: #0000ff}
+.r13 {color: #f6c177; text-decoration-color: #f6c177}
+.r14 {color: #eb6f92; text-decoration-color: #eb6f92; font-weight: bold}
+body {
+    color: #000000;
+    background-color: #ffffff;
+}
+</style>
+</head>
+<html>
+<body>
+    <code>
+        <pre style="font-family:Menlo,'DejaVu Sans Mono',consolas,'Courier New',monospace"><span class="r1">─────────────────────────────────────────────────────────────────────────────────────────────────── </span>🍇 Linear Regression - Wine data<span class="r1"> ────────────────────────────────────────────────────────────────────────────────────────────────────</span>
+<span class="r2">📆 November </span><span class="r3">02</span><span class="r2"> </span><span class="r3">2022</span><span class="r2"> </span><span class="r4">02:04:18</span>
+🐼 <span class="r2">Created by</span> <span class="r5">Ludek Cizinsky</span>
+<span class="r1">──────────────────────────────────────────────────────────────────────────────────────────────────── </span>🚧 Prepare input for the model<span class="r1"> ─────────────────────────────────────────────────────────────────────────────────────────────────────</span>
+<span class="r6">🐍 Load and split data</span>
+<span class="r6">🐍 Train test split</span>
+<span class="r6">🐍 Process the data</span>
+<span class="r1">────────────────────────────────────────────────────────────────────────────────────────────────────────── </span>🤖 Train the model<span class="r1"> ───────────────────────────────────────────────────────────────────────────────────────────────────────────</span>
+╭──── table of training ────╮       ╭───── training information ──────╮
+│ ┏━━━━━━━┳━━━━━━━━┳━━━━━━┓ │       │                                 │
+│ ┃<span class="r7"> Epoch </span>┃<span class="r7">  Loss  </span>┃<span class="r7"> MAEr </span>┃ │       │        <span class="r8">Hyper-parameters</span>         │
+│ ┡━━━━━━━╇━━━━━━━━╇━━━━━━┩ │       │                                 │
+│ │<span class="r2"> 00001 </span>│<span class="r9"> 02.670 </span>│<span class="r10"> 0.82 </span>│ │       │ Following hyper-parameters have │
+│ │<span class="r2"> 00002 </span>│<span class="r9"> 00.727 </span>│<span class="r10"> 0.62 </span>│ │       │ been used:                      │
+│ │<span class="r2"> 00003 </span>│<span class="r9"> 00.304 </span>│<span class="r10"> 0.43 </span>│ │       │                                 │
+│ │<span class="r2"> 00004 </span>│<span class="r9"> 00.207 </span>│<span class="r10"> 0.49 </span>│ │       │ <span class="r11"> • </span>Epochs: 25                   │
+│ │<span class="r2"> 00005 </span>│<span class="r9"> 00.195 </span>│<span class="r10"> 0.33 </span>│ │       │ <span class="r11"> • </span>Loss func: mse               │
+│ │<span class="r2"> 00006 </span>│<span class="r9"> 00.142 </span>│<span class="r10"> 0.43 </span>│ │       │ <span class="r11"> • </span>Batch size: 29               │
+│ │<span class="r2"> 00007 </span>│<span class="r9"> 00.137 </span>│<span class="r10"> 0.46 </span>│ │       │ <span class="r11"> • </span>LR: 0.15                     │
+│ │<span class="r2"> 00008 </span>│<span class="r9"> 00.193 </span>│<span class="r10"> 0.28 </span>│ │       │                                 │
+│ │<span class="r2"> 00009 </span>│<span class="r9"> 00.108 </span>│<span class="r10"> 0.28 </span>│ │       │                                 │
+│ │<span class="r2"> 00010 </span>│<span class="r9"> 00.087 </span>│<span class="r10"> 0.23 </span>│ │       │          <span class="r8">Training plot</span>          │
+│ │<span class="r2"> 00011 </span>│<span class="r9"> 00.093 </span>│<span class="r10"> 0.29 </span>│ │       │                                 │
+│ │<span class="r2"> 00012 </span>│<span class="r9"> 00.093 </span>│<span class="r10"> 0.26 </span>│ │       │ 📈 See training plot <a class="r12" href="figures/training.png">here</a>       │
+│ │<span class="r2"> 00013 </span>│<span class="r9"> 00.085 </span>│<span class="r10"> 0.26 </span>│ │       ╰─────────────────────────────────╯
+│ │<span class="r2"> 00014 </span>│<span class="r9"> 00.080 </span>│<span class="r10"> 0.24 </span>│ │                                          
+│ │<span class="r2"> 00015 </span>│<span class="r9"> 00.118 </span>│<span class="r10"> 0.45 </span>│ │                                          
+│ │<span class="r2"> 00016 </span>│<span class="r9"> 00.148 </span>│<span class="r10"> 0.24 </span>│ │                                          
+│ │<span class="r2"> 00017 </span>│<span class="r9"> 00.088 </span>│<span class="r10"> 0.40 </span>│ │                                          
+│ │<span class="r2"> 00018 </span>│<span class="r9"> 00.105 </span>│<span class="r10"> 0.43 </span>│ │                                          
+│ │<span class="r2"> 00019 </span>│<span class="r9"> 00.126 </span>│<span class="r10"> 0.26 </span>│ │                                          
+│ │<span class="r2"> 00020 </span>│<span class="r9"> 00.078 </span>│<span class="r10"> 0.24 </span>│ │                                          
+│ │<span class="r2"> 00021 </span>│<span class="r9"> 00.076 </span>│<span class="r10"> 0.27 </span>│ │                                          
+│ │<span class="r2"> 00022 </span>│<span class="r9"> 00.070 </span>│<span class="r10"> 0.22 </span>│ │                                          
+│ │<span class="r2"> 00023 </span>│<span class="r9"> 00.066 </span>│<span class="r10"> 0.31 </span>│ │                                          
+│ │<span class="r2"> 00024 </span>│<span class="r9"> 00.120 </span>│<span class="r10"> 0.52 </span>│ │                                          
+│ │<span class="r2"> 00025 </span>│<span class="r9"> 00.118 </span>│<span class="r10"> 0.23 </span>│ │                                          
+│ └───────┴────────┴──────┘ │                                          
+╰───────────────────────────╯                                          
+<span class="r1">───────────────────────────────────────────────────────────────────────────────────────────────────────── </span>🔮 Validate the model<span class="r1"> ─────────────────────────────────────────────────────────────────────────────────────────────────────────</span>
+🚥 <span class="r13">MSE</span>: <span class="r14">3.6739563478051167</span>
+</pre>
+    </code>
+</body>
+</html>
@@ -0,0 +1,5 @@
+from ._linr import LinearRegression
+
+__all__  = [
+    "LinearRegression"
+]
@@ -0,0 +1,103 @@
+import numpy as np
+from rich.progress import track
+
+from nnlearn.reporting import GdReport
+from nnlearn.nanograd import Var
+from nnlearn.base import GdBase
+
+class LinearRegression(GdBase, GdReport):
+
+    def __init__(self,
+        optimizer='gd_backp',
+        loss_func='mse',
+        epochs=50,
+        batch_size=1.0,
+        shuffle=False,
+        lr=.01,
+        bias=True,
+        figpath=""):
+        
+        # Common attributes to models optimized via GD
+        GdBase.__init__(self,
+                        batch_size,
+                        shuffle,
+                        loss_func,
+                        epochs,
+                        lr)
+
+        # Reporting
+        GdReport.__init__(self, figpath, 'reg')
+
+        # LR specific
+        self.optimizer = optimizer
+        self.bias = bias
+        self._theta = None
+
+    def _zero_grads(self):
+        for w in self._theta[:, 0]:
+            w.grad = 0
+
+    def _update_weights(self):
+        for w in self._theta[:, 0]:
+            w.v -= self.lr * w.grad
+
+    def _forward(self, X):
+        return (X @ self._theta)[:, 0]
+
+    def _train(self):
+        for epoch in track(range(1, self.epochs + 1), "Training..."):
+            self._reshuffle()
+            X_batches, y_batches = self._get_batches()
+
+            batch = 1
+            losses = []
+            for X, y in zip(X_batches, y_batches):
+
+                # Predict
+                yhat = self._forward(X)
+
+                # Compute loss based on the prediction
+                loss = self.loss_func(y, yhat)
+                losses.append(loss.v)
+
+                # reset gradients of variables to zero
+                self._zero_grads() 
+
+                # backward propagate
+                loss.backward()
+
+                # update weights
+                self._update_weights()
+                
+                # Increase batch number
+                batch += 1
+            
+            # Epoch evaluation
+            yhat_train = self._arr_to_val(self._forward(self.Xv))
+            y_train = self._arr_to_val(self.yv)
+            self.eval_epoch(epoch, losses, y_train, yhat_train)
+
+        self.create_report(self.loss_func_name, self.batch_size, self.lr)
+
+    def _initialize_parameters(self, m):
+        m = m + 1 if self.bias else m
+        self._theta = np.random.normal(0, 1, m).reshape(-1, 1)
+        if self.optimizer == 'gd_backp':
+            self._theta = self._arr_to_var(self._theta)
+
+    def _add_constant_column(self, X):
+        if self.bias: 
+            X = np.hstack((X, np.ones((X.shape[0], 1), dtype=X.dtype)))
+        return X
+ 
+    def fit(self, X, y):
+        self._initialize_parameters(X.shape[1])
+        X = self._add_constant_column(X)
+        self._preprocessing(X, y)
+        self._train()
+    
+    def predict(self, X):
+        X = self._add_constant_column(X)
+        Xv = self._arr_to_var(X)
+        yhat = self._arr_to_val(self._forward(Xv))
+        return yhat
@@ -9,8 +9,9 @@
 """
 
 import numpy as np
+from nnlearn.nanograd import Var
 
-def squared_error(y, p):
+def squared_error(y, p, var):
     """Squared error.
 
     Sqaured error can be defined as follows:
@@ -38,26 +39,41 @@ def squared_error(y, p):
     -----
     Usually used for regression problems.
     """
-    return np.sum((y - p)**2)
+    if var:
+        return (y - p).sqr()
+    else:
+        return np.sum((y - p)**2)
 
-def mean_squared_error(y, p):
+def mean_squared_error(Y, P, var=True):
     """Mean of squared error
 
     Parameters
     ----------
-    y : :class:`ndarray`
+    Y : :class:`ndarray`
         One dimensional array with ground truth values.
     
-    p : :class:`ndarray`
+    P : :class:`ndarray`
         One dimensional array with predicted values.
 
     Returns
     -------
     float
         Mean squared error.
     """
-    n = y.shape[0]
-    return squared_error(y, p)/n
+
+    if var:
+        n = Var(Y.shape[0])
+        total = Var(0)
+        for i in range(n.v):
+          y = Y[i] # true class
+          yhat = P[i]
+          total += squared_error(y, yhat, var)
+
+        return total/n
+
+    else:
+        n = Y.shape[0]
+        return squared_error(Y, P, var)
 
 def absolute_error(y, p):
 
 
@@ -59,6 +59,9 @@ def log2(self) -> 'Var':
     def exp(self) -> 'Var':
         return Var(np.exp(self.v), [(self, np.exp(self.v))])
 
+    def sqr(self) -> 'Var':
+        return Var(self.v**2, [(self, 2*self.v)])
+
     def __repr__(self):
         return "Var(v=%.4f, grad=%.4f)" % (self.v, self.grad)
 
@@ -60,7 +60,7 @@ def __init__(self,
                         lr)
 
         # Reporting
-        GdReport.__init__(self, figpath)
+        GdReport.__init__(self, figpath, 'clf')
 
         # FFNN specific
         self.layers = layers