# Training notebook

## Please install the requirements
(if you don't have them already)

In [2]:
%pip install torchvision
%pip install torch torchvision
%pip install --upgrade ultralytics
%pip install pillow_heif
%pip install plotly
%pip install Pillow
%pip install tqdm
%pip install ruamel.yaml

Defaulting to user installation because normal site-packages is not writeable
Collecting torchvision
  Downloading torchvision-0.18.0-cp310-cp310-manylinux1_x86_64.whl (7.0 MB)
[2K     [38;2;114;156;31m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m7.0/7.0 MB[0m [31m9.5 MB/s[0m eta [36m0:00:00[0m0m eta [36m0:00:01[0m[36m0:00:01[0m
Collecting torch==2.3.0
  Downloading torch-2.3.0-cp310-cp310-manylinux1_x86_64.whl (779.1 MB)
[2K     [38;2;114;156;31m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m779.1/779.1 MB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:07[0m
[?25hCollecting nvidia-cufft-cu12==11.0.2.54
  Downloading nvidia_cufft_cu12-11.0.2.54-py3-none-manylinux1_x86_64.whl (121.6 MB)
[2K     [38;2;114;156;31m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚

In [1]:
import os  # for file operations
import json  # for loading the annotations file
from PIL import Image, ImageDraw, ImageOps, ImageEnhance  # for processing the image data
import numpy as np
from random import shuffle
import nvidia.cudnn
import torch
from pillow_heif import register_heif_opener

os.environ["CUDA_VISIBLE_DEVICES"] = "1"

## Constants

In [2]:
DATA_PATH = "./data/"  # must contain multiple subdirectories - one for each class
ANNOTATIONS_PATH = "./via-annotations.json"  # relative to the notebook
YOLO_CONFIG_PATH = "yolo.yaml"

BATCH_SIZE = 8

CLASS_NAMES = sorted(list(set([os.path.basename(f).split(",")[0] for f in os.scandir(DATA_PATH) if f.is_dir()])))  # automatically generated
ALL_CLASS_NAMES = sorted(list(set([os.path.basename(f) for f in os.scandir(DATA_PATH) if f.is_dir()])))
CLASS_COUNT = len(CLASS_NAMES)

## Data size chart (treemap)

In [6]:
import os
import collections
import plotly.express as px
import plotly.io as pio
import pandas as pd

pio.renderers.default = "iframe"

subcategories = collections.defaultdict(list)

for klass in ALL_CLASS_NAMES:
    main, _, sub = klass.partition(", ")
    file_count = len(os.listdir(os.path.join(DATA_PATH, klass)))  # count files in each subcategory directory
    subcategories[main].append((sub, file_count))

categories = []
subcategories_list = []
values = []

for main, subs in subcategories.items():
    for sub, count in subs:
        categories.append(main)
        subcategories_list.append(sub)
        values.append(count)

df = pd.DataFrame({
    "Category": categories,
    "Subcategory": subcategories_list,
    "Number of samples": values
})

fig = px.treemap(
    df,
    path=[px.Constant("data"), "Category", "Subcategory"],
    values="Number of samples",
    title="Treemap of classes"
)

# The palette (from Google)
material_colours_hex = [
    "#009688",  # Teal
    "#4CAF50",  # Green
    "#8BC34A",  # Light Green
    "#CDDC39",  # Lime
    "#FFEB3B",  # Yellow
    "#FFC107",  # Amber
    "#FF9800",  # Orange
    "#FF5722",  # Deep Orange
    "#F44336",  # Red
    "#E91E63",  # Pink
    "#9C27B0",  # Purple
    "#673AB7",  # Deep Purple
    "#3F51B5",  # Indigo
    "#2196F3",  # Blue
    "#03A9F4",  # Light Blue
    "#00BCD4",  # Cyan
    "#795548",  # Brown
    "#9E9E9E",  # Grey
    "#607D8B",  # Blue Grey
]


fig.update_layout(
        width=2400, height=1200,
        treemapcolorway=material_colours_hex
)

fig.show()


## Data augmentation and conversion to YOLO format
We convert the data from the VGG Image Annotator format to the format used in the YOLO pipeline.

Data augmentation is also performed to increase the diversity of the dataset.
* Random rotation and flipping
* Random brightness
* Random contrast
* Random sharpness
* Random colour
* Random RGB deviation
* Salt and pepper noise
* JPEG compression

In [4]:
import json
import os
import shutil
import random
import math
from PIL import Image, UnidentifiedImageError, ImageEnhance, ImageOps
from tqdm import tqdm

def rotate_point(point, origin, angle):
    # Fast calculation for 90 degree rotations
    match angle % 360:
        case 0:
            return point
        case 90:
            return origin[1] + origin[0] - point[1], origin[1] - origin[0] + point[0]
        case 180:
            return 2 * origin[0] - point[0], 2 * origin[1] - point[1]
        case 270:
            return origin[1] - origin[0] + point[1], origin[1] + origin[0] - point[0]
    
    # Otherwise do math
    angle_rad = math.radians(angle)
    ox, oy = origin
    px, py = point
    
    qx = ox + math.cos(angle_rad) * (px - ox) - math.sin(angle_rad) * (py - oy)
    qy = oy + math.sin(angle_rad) * (px - ox) + math.cos(angle_rad) * (py - oy)
    
    return qx, qy

def save_photos(via_annotations_path, images_directory, output_directory, num_augmented_copies=3, save_quality=80):
    annotated_images = 0
    
    if os.path.exists(output_directory):
        shutil.rmtree(output_directory)
    os.makedirs(output_directory)

    with open(via_annotations_path, 'r') as f:
        data = json.load(f)
        
    rotation_angles = [0, 90, 180, 270]

    class_mapping = {}

    for image_id, image_data in tqdm(data["_via_img_metadata"].items()):
        filename = image_data["filename"]
        image_path = os.path.normpath(os.path.join(images_directory, filename))
        try:
            image = Image.open(image_path)
        except (UnidentifiedImageError, IOError):
            continue        # skip non-image or missing files

        image.verify()      # verify that it is, indeed, an image
        image.close()

        image = Image.open(image_path)
        w, h = image.size
        cx, cy = w / 2, h / 2

        class_name = os.path.basename(os.path.dirname(image_path)).split(",")[0]
        if class_name not in class_mapping:
            # Add new classes when encountered
            class_mapping[class_name] = len(class_mapping)
            
        # Skip images with no annotations
        if "regions" not in image_data or len(image_data['regions']) == 0:
            continue
        
        annotated_images += 1

        # Generate augmented copies, but always keep the original image as well
        for i in range(num_augmented_copies + 1):
            if not i:
                output_image_path = os.path.join(output_directory, os.path.basename(image_path))
            else:
                output_image_path = os.path.join(output_directory, os.path.splitext(os.path.basename(image_path))[0] + "_" + str(i) + os.path.splitext(image_path)[1])    # append suffix to avoid clashes
            transform_info_output_path = os.path.join(output_directory, os.path.splitext(os.path.basename(output_image_path))[0] + ".info.txt")
            if os.path.exists(transform_info_output_path):
                # This image was already transformed from another class, so we're adding the annotations from this one
                # as well
                with open(transform_info_output_path, "r") as info_file:
                    angle, flip = map(int, info_file.read().split())
            else:
                # Resize the image so the following operations are faster and the data size is reduced
                x_multiplier = 640/w
                y_multiplier = 640/h
                # image.thumbnail((640, 640), Image.HAMMING)
                image = image.resize((640, 640), Image.HAMMING)
                if not i:
                    # Keep the original image
                    angle = 0
                    flip = False
                    image.save(output_image_path)
                else:
                    angle = random.choice(rotation_angles)
                
                    # Random rotation
                    modified_image = image.rotate(angle, resample=Image.BICUBIC, expand=True)
                    # Random brightness
                    enhancer = ImageEnhance.Brightness(modified_image)
                    modified_image = enhancer.enhance(random.uniform(0.75, 1.25))
                    # Random contrast
                    enhancer = ImageEnhance.Contrast(modified_image)
                    modified_image = enhancer.enhance(random.uniform(0.625, 1.375))
                    # Random sharpness
                    enhancer = ImageEnhance.Sharpness(modified_image)
                    modified_image = enhancer.enhance(random.uniform(0.5, 1.5))
                    # Random colour
                    enhancer = ImageEnhance.Color(modified_image)
                    modified_image = enhancer.enhance(random.uniform(0.625, 1.375))
                    # Random horizontal flip
                    if random.random() < 0.5:
                        flip = True
                        modified_image = ImageOps.mirror(modified_image)
                    else:
                        flip = False
                    # Random RGB deviation
                    r_multiplier = random.uniform(0.875, 1.125)
                    g_multiplier = random.uniform(0.875, 1.125)
                    b_multiplier = random.uniform(0.875, 1.125)
                    r, g, b = modified_image.split()
                    r = r.point(lambda p: min(255, max(0, int(p * r_multiplier))))
                    g = g.point(lambda p: min(255, max(0, int(p * g_multiplier))))
                    b = b.point(lambda p: min(255, max(0, int(p * b_multiplier))))
                    modified_image = Image.merge("RGB", (r, g, b))
                    # Noise
                    try:
                        noise = Image.new("RGB", modified_image.size, (0, 0, 0))
                        for _ in range(int(image.width * image.height * 0.01)):
                            x, y = random.randint(0, image.width - 1), random.randint(0, image.height - 1)
                            # Salt or pepper?
                            if random.random() > 0.25:
                                noise.putpixel((x, y), (255, 255, 255))
                            else:
                                noise.putpixel((x, y), (0, 0, 0))
                        modified_image = Image.blend(modified_image, noise, 0.125)
                    except IndexError:
                        # Image is buggy
                        pass
                    modified_image.save(output_image_path, quality=save_quality)   # low quality to save space and diversify the dataset

            annotations_output_path = os.path.join(output_directory, os.path.splitext(os.path.basename(output_image_path))[0] + ".txt")
            with open(annotations_output_path, "a") as file:
                if "regions" not in image_data or len(image_data["regions"]) == 0:
                    continue  # skip unannotated images
                for region in image_data['regions']:
                    shape_attr = region['shape_attributes']
                    points = []
                    if shape_attr['name'] == 'rect':
                        x, y, width, height = shape_attr['x'], shape_attr['y'], shape_attr['width'], shape_attr['height']
                        points = [(x, y), (x + width, y), (x + width, y + height), (x, y + height)]
                    elif shape_attr['name'] == 'polygon':
                        points = list(zip(shape_attr['all_points_x'], shape_attr['all_points_y']))
                    elif shape_attr['name'] == 'circle':
                        cx, cy, r = shape_attr['cx'], shape_attr['cy'], shape_attr['r']
                        points = [(cx - r, cy - r), (cx + r, cy - r), (cx + r, cy + r), (cx - r, cy + r)]
                    elif shape_attr['name'] == 'ellipse':
                        cx, cy, rx, ry = shape_attr['cx'], shape_attr['cy'], shape_attr['rx'], shape_attr['ry']
                        angle += shape_attr.get("theta", 0)  # Add the rotation angle
                        points = [(cx - rx, cy - ry), (cx + rx, cy - ry), (cx + rx, cy + ry), (cx - rx, cy + ry)]

                    # Rotate points
                    if flip:
                        points = [(w - pt[0], pt[1]) for pt in points]
                    rotated_points = [rotate_point(pt, (cx, cy), angle) for pt in points]
                    min_x = max(0, min(pt[0] for pt in rotated_points))
                    max_x = min(w, max(pt[0] for pt in rotated_points))
                    min_y = max(0, min(pt[1] for pt in rotated_points))
                    max_y = min(h, max(pt[1] for pt in rotated_points))

                    x_center = ((min_x + max_x) / 2) / w
                    y_center = ((min_y + max_y) / 2) / h
                    box_width = (max_x - min_x) / w
                    box_height = (max_y - min_y) / h
                    file.write(f"{class_mapping[class_name]} {x_center} {y_center} {box_width} {box_height}\n")
            with open(transform_info_output_path, "w") as info_file:
                    # Copies of the image will transform points in the same way
                    info_file.write(f"{angle} {int(flip)}")
    
    return class_mapping, annotated_images

OUTPUT_PATH = "yolo_data/"
class_mapping, annotated_images = save_photos(ANNOTATIONS_PATH, DATA_PATH, OUTPUT_PATH)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 11191/11191 [02:29<00:00, 74.96it/s]


We set the class names in the YOLO configuration file to the ones discovered while loading the data.

In [4]:
print(f"{annotated_images} images processed.")

1650 images processed.


In [None]:
from ruamel.yaml import YAML
print(len(class_mapping), class_mapping)

# Set the class names
yaml = YAML()
with open(YOLO_CONFIG_PATH, "r") as file:
    data = yaml.load(file)
    data["nc"] = len(class_mapping)
    data["names"] = class_mapping

## Training

In [5]:
from ultralytics import YOLO

model = YOLO("runs/detect/train29/weights/best.pt")

results = model.train(data=YOLO_CONFIG_PATH, epochs=72, verbose=True, imgsz=640)

New https://pypi.org/project/ultralytics/8.2.22 available üòÉ Update with 'pip install -U ultralytics'
Ultralytics YOLOv8.2.21 üöÄ Python-3.10.0 torch-2.3.0+cu121 CPU (13th Gen Intel Core(TM) i9-13900KF)
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=runs/detect/train29/weights/best.pt, data=yolo.yaml, epochs=72, time=None, patience=100, batch=16, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train30, exist_ok=False, pretrained=True, optimizer=auto, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_mas

[34m[1mtrain: [0mScanning /home/vlad/Desktop/litewaste/yolo_data... 6476 images, 0 backgrounds, 24 corrupt: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 6476/6476 [00[0m

[34m[1mtrain: [0mNew cache created: /home/vlad/Desktop/litewaste/yolo_data.cache



[34m[1mval: [0mScanning /home/vlad/Desktop/litewaste/yolo_data.cache... 6476 images, 0 backgrounds, 24 corrupt: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 6476/6476[0m






Plotting labels to runs/detect/train30/labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m AdamW(lr=0.000714, momentum=0.9) with parameter groups 57 weight(decay=0.0), 64 weight(decay=0.0005), 63 bias(decay=0.0)
Image sizes 640 train, 640 val
Using 0 dataloader workers
Logging results to [1mruns/detect/train30[0m
Starting training for 72 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       1/72         0G      1.102      1.347      1.533          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:46<00:00,  1.15s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:13<00:00,

                   all       6452       7988      0.818      0.681      0.749      0.543






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       2/72         0G      1.099      1.306      1.517         21        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:43<00:00,  1.15s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:57<00:00,

                   all       6452       7988      0.772       0.68      0.735      0.521






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       3/72         0G      1.113       1.34      1.522          7        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:39<00:00,  1.14s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:03<00:00,

                   all       6452       7988      0.764      0.644        0.7      0.477






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       4/72         0G      1.125      1.364      1.529         16        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:38<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.815      0.629      0.734      0.479






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       5/72         0G      1.132      1.347      1.534         13        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.786      0.638       0.72      0.487






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       6/72         0G      1.115      1.359      1.523         11        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:55<00:00,

                   all       6452       7988       0.76      0.676      0.736      0.499






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       7/72         0G      1.117      1.345       1.52          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:58<00:00,

                   all       6452       7988       0.83      0.653      0.745      0.509






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       8/72         0G      1.103      1.329      1.508         19        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988       0.79      0.634      0.735       0.51






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       9/72         0G      1.104      1.335      1.506         10        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:03<00:00,

                   all       6452       7988      0.795      0.663       0.74      0.518






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      10/72         0G      1.099      1.308      1.509         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.812      0.684      0.778      0.532






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      11/72         0G      1.094      1.314      1.501          8        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.815       0.66      0.769       0.53






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      12/72         0G      1.068      1.278      1.478         10        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.797       0.67      0.761      0.529






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      13/72         0G      1.077       1.28       1.49         10        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.817       0.69      0.778      0.545






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      14/72         0G      1.075      1.265      1.484         10        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.789      0.684      0.774      0.534






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      15/72         0G      1.066      1.261      1.473          6        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.821      0.687      0.788       0.55






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      16/72         0G      1.048       1.23      1.463          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.838      0.717        0.8       0.57






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      17/72         0G      1.051      1.226      1.461         13        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.826      0.716      0.805      0.564






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      18/72         0G      1.043      1.228       1.46         14        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:55<00:00,

                   all       6452       7988      0.857      0.712      0.804      0.562






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      19/72         0G      1.039      1.206      1.451         17        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988       0.79      0.762      0.815      0.581






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      20/72         0G      1.028      1.187      1.449         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:09<00:00,

                   all       6452       7988      0.832      0.697      0.798      0.563






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      21/72         0G      1.027      1.176      1.435          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.821       0.71        0.8      0.568






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      22/72         0G      1.031      1.171      1.441         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.863      0.711      0.819      0.593






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      23/72         0G      1.019      1.175      1.434         17        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:02<00:00,

                   all       6452       7988      0.822      0.761      0.827       0.58






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      24/72         0G      1.013       1.16      1.429          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:03<00:00,

                   all       6452       7988      0.872      0.741      0.835      0.612






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      25/72         0G      1.002      1.159      1.427          8        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:10<00:00,

                   all       6452       7988      0.846      0.721      0.823      0.598






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      26/72         0G      1.008       1.15      1.429         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:56<00:00,

                   all       6452       7988      0.876       0.71      0.825      0.604






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      27/72         0G     0.9911      1.145      1.415         10        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.852      0.754      0.835      0.607






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      28/72         0G      1.001      1.121       1.42          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.883      0.729      0.834      0.606






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      29/72         0G     0.9845        1.1       1.41          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:56<00:00,

                   all       6452       7988       0.83      0.748      0.833      0.609






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      30/72         0G     0.9829        1.1      1.402          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:56<00:00,

                   all       6452       7988      0.861      0.752      0.849      0.621






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      31/72         0G     0.9811      1.106      1.406          8        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:07<00:00,

                   all       6452       7988      0.864      0.767      0.855       0.63






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      32/72         0G     0.9749      1.108      1.404          8        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:54<00:00,

                   all       6452       7988      0.869      0.765      0.845      0.629






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      33/72         0G     0.9806       1.09      1.407          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:06<00:00,

                   all       6452       7988      0.864      0.775      0.848      0.627






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      34/72         0G     0.9721      1.088      1.401         16        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:11<00:00,

                   all       6452       7988      0.879      0.779       0.86      0.644






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      35/72         0G     0.9538      1.061      1.383         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:55<00:00,

                   all       6452       7988        0.9      0.765      0.859      0.646






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      36/72         0G     0.9526      1.061      1.385          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.868      0.784      0.857      0.649






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      37/72         0G     0.9542      1.054      1.379          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.898      0.771      0.863      0.647






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      38/72         0G     0.9578      1.058      1.388          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.911      0.775      0.871      0.647






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      39/72         0G     0.9413      1.049      1.369          7        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:54<00:00,

                   all       6452       7988        0.9       0.78      0.874      0.664






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      40/72         0G     0.9424      1.044      1.371         13        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:08<00:00,

                   all       6452       7988      0.888      0.782      0.869      0.663






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      41/72         0G     0.9384      1.028      1.368         18        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:10<00:00,

                   all       6452       7988      0.885      0.788      0.874      0.668






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      42/72         0G     0.9315      1.027      1.362         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:05<00:00,

                   all       6452       7988      0.888      0.794      0.876      0.668






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      43/72         0G     0.9249      1.017      1.359         15        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.898      0.807       0.88      0.676






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      44/72         0G     0.9239      1.014      1.361          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:05<00:00,

                   all       6452       7988      0.892      0.809      0.883      0.675






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      45/72         0G     0.9146      1.006      1.357         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:06<00:00,

                   all       6452       7988      0.916      0.792      0.885      0.683






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      46/72         0G     0.9076     0.9977      1.343         11        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:37<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:07<00:00,

                   all       6452       7988       0.92        0.8       0.89      0.695






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      47/72         0G     0.9101     0.9993      1.344          7        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:30<00:00,  1.11s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.898      0.811      0.889        0.7






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      48/72         0G     0.8933     0.9718      1.335         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:58<00:00,

                   all       6452       7988      0.896       0.82       0.89      0.691






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      49/72         0G     0.8944     0.9801      1.335          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:01<00:00,

                   all       6452       7988      0.897       0.82      0.892      0.696






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      50/72         0G     0.8886     0.9632      1.335          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:31<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.904      0.827      0.897      0.697






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      51/72         0G     0.9016     0.9811      1.339          6        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:30<00:00,  1.11s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:58<00:00,

                   all       6452       7988      0.915      0.815      0.895      0.703






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      52/72         0G     0.8912     0.9615      1.334         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:58<00:00,

                   all       6452       7988      0.921      0.821      0.897      0.708






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      53/72         0G     0.8856     0.9678      1.334          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:02<00:00,

                   all       6452       7988      0.895      0.838      0.896      0.703






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      54/72         0G      0.883     0.9641      1.331         14        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:05<00:00,

                   all       6452       7988      0.911      0.814      0.897      0.712






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      55/72         0G     0.8687     0.9387      1.313          8        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:31<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:02<00:00,

                   all       6452       7988      0.903      0.828      0.899      0.712






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      56/72         0G     0.8732     0.9366      1.321          9        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.908      0.828      0.902      0.718






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      57/72         0G     0.8708     0.9225      1.315          7        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:11<00:00,

                   all       6452       7988      0.914      0.829      0.903      0.715






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      58/72         0G     0.8669     0.9396      1.311         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:34<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:03<00:00,

                   all       6452       7988      0.916      0.834      0.907      0.722






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      59/72         0G     0.8661     0.9353      1.313         14        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:58<00:00,

                   all       6452       7988      0.919      0.831      0.908      0.725






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      60/72         0G      0.855     0.9054      1.305         11        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:36<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:07<00:00,

                   all       6452       7988      0.907      0.844      0.908      0.725






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      61/72         0G     0.8508     0.9043      1.299         12        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:33<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:05<00:00,

                   all       6452       7988      0.925      0.827      0.908      0.725






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      62/72         0G     0.8479     0.9091        1.3         16        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:35<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:59<00:00,

                   all       6452       7988      0.921      0.838      0.908      0.727





Closing dataloader mosaic

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      63/72         0G     0.8007     0.7174      1.339          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:38<00:00,  1.13s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:00<00:00,

                   all       6452       7988      0.919      0.837      0.907      0.722






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      64/72         0G     0.7749     0.6679      1.321          6        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:30<00:00,  1.11s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:03<00:00,

                   all       6452       7988      0.907      0.844      0.908      0.727






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      65/72         0G     0.7524     0.6453      1.301          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:27<00:00,  1.11s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:08<00:00,

                   all       6452       7988      0.914       0.85      0.912      0.732






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      66/72         0G     0.7461     0.6358      1.292          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:25<00:00,  1.10s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.925      0.851      0.914       0.74






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      67/72         0G      0.738     0.6289      1.285          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:32<00:00,  1.12s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:14<00:00,

                   all       6452       7988      0.916      0.857      0.916      0.745






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      68/72         0G     0.7286     0.6217      1.276          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:56<00:00,  1.18s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:15<00:00,

                   all       6452       7988      0.929      0.851      0.917      0.745






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      69/72         0G     0.7264     0.6271      1.274          4        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:52<00:00,  1.17s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:12<00:00,

                   all       6452       7988      0.929      0.853      0.917      0.746






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      70/72         0G      0.717     0.6182       1.26          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:51<00:00,  1.17s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:08<00:00,

                   all       6452       7988      0.928      0.853      0.917      0.748






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      71/72         0G     0.7208     0.6187      1.274          5        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:29<00:00,  1.11s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:17<00:00,

                   all       6452       7988      0.932       0.85      0.919      0.748






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      72/72         0G     0.7122     0.6066      1.262          6        640: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 404/404 [07:39<00:00,  1.14s/it]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [03:04<00:00,

                   all       6452       7988      0.927      0.856      0.919      0.749






72 epochs completed in 12.779 hours.
Optimizer stripped from runs/detect/train30/weights/last.pt, 6.3MB
Optimizer stripped from runs/detect/train30/weights/best.pt, 6.3MB

Validating runs/detect/train30/weights/best.pt...
Ultralytics YOLOv8.2.21 üöÄ Python-3.10.0 torch-2.3.0+cu121 CPU (13th Gen Intel Core(TM) i9-13900KF)
Model summary (fused): 168 layers, 3007598 parameters, 0 gradients, 8.1 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 202/202 [02:36<00:00,


                   all       6452       7988      0.927      0.855      0.919      0.749
               Textile       6452        190      0.923      0.911      0.949      0.777
                 Paper       6452       2131      0.957      0.922      0.967      0.834
               Plastic       6452       2817      0.946      0.889      0.951      0.796
                 Other       6452        424      0.924      0.776      0.845      0.668
                 Metal       6452       1147      0.958      0.861      0.949      0.823
               Medical       6452         12       0.94          1      0.995       0.82
                  Wood       6452        164      0.882      0.819      0.909      0.686
                 Glass       6452        295      0.957      0.898      0.967      0.818
               Organic       6452        676      0.907      0.827      0.929      0.756
            Electronic       6452        132      0.878      0.652      0.733      0.519
Speed: 0.5ms preproce

In [None]:
torch.save(model.state_dict(), "model.pt")

## Inferencing
Retrieve the class mapping that was discovered earlier and used in training.

In [6]:
# Get the class mapping
from ruamel.yaml import YAML

yaml = YAML()

with open("yolo.yaml", "r") as file:
    data = yaml.load(file)
    class_mapping = data["names"]

### With live webcam feed

In [20]:
from ultralytics import YOLO
import os

model = YOLO("runs/detect/train26/weights/best.pt")

import cv2 as cv
import numpy as np
import torchvision.transforms as transforms
from PIL import Image, ImageFont, ImageDraw

import matplotlib.pyplot as plt
import matplotlib.patches as patches

# Start the webcam
import numpy as np
import math
cap = cv.VideoCapture(0)
cap.set(3, 640)
cap.set(4, 640)


font = ImageFont.truetype("/usr/share/fonts/truetype/dejavu/DejaVuSansMono.ttf", 20)

while True:
    success, img = cap.read()
    results = model(img, stream=True, verbose=False)

    for r in results:
        boxes = r.boxes

        for box in boxes:
            confidence = round(float(box.conf[0] * 100))

            # Skip unsure detections
            if confidence < 0:
                continue
            
            # Get coordinates and draw the bounding box
            x1, y1, x2, y2 = box.xyxy[0]
            x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)
            
            cv.rectangle(img, (x1, y1), (x2, y2), (255, 255, 255), 2)
            cv.rectangle(img, (x1-1, y1-1), (x2+1, y2+1), (136, 150, 0), 2)
            
            cls = int(box.cls[0])

            # Object label
            img_pil = Image.fromarray(img)
            draw = ImageDraw.Draw(img_pil)
            draw.text((x1, y1),
                      f"[{confidence}%] {class_mapping[cls]}",
                      font=font,
                      fill=(255, 255, 255),
                      stroke_width=1,
                      stroke_fill=(0, 0, 0))
            img = np.array(img_pil)


    cv.imshow("Webcam capture demo", img)
    if cv.waitKey(1) == 27:    # escape
        break

# Stop the webcam
cap.release()
cv.destroyAllWindows()

KeyboardInterrupt: 

### From a photo file

In [14]:
from ultralytics import YOLO
import os

model = YOLO("runs/detect/train28/weights/best.pt")

import cv2 as cv
import numpy as np
import torchvision.transforms as transforms
from PIL import Image, ImageFont, ImageDraw

import matplotlib.pyplot as plt
import matplotlib.patches as patches

import numpy as np
import math

font = ImageFont.truetype("/usr/share/fonts/truetype/dejavu/DejaVuSansMono.ttf", 20)

image_dir = "./test_data/"
output_dir = "./output/"

for image_path in os.scandir(image_dir):
    img = cv.imread(image_path.path)
    results = model(img)
    
    for r in results:
        boxes = r.boxes
        
        # Geometric mean of the confidence values
        min_confidence = np.mean([box.conf[0].cpu() for box in boxes]) * 87.5
    
        for box in boxes:
            confidence = round(float(box.conf[0] * 100))
    
            # Skip unsure detections
            if confidence < min_confidence:
                continue
            
            # Get coordinates and draw the bounding box
            x1, y1, x2, y2 = box.xyxy[0]
            x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)
            
            cv.rectangle(img, (x1, y1), (x2, y2), (255, 255, 255), 2)
            cv.rectangle(img, (x1-1, y1-1), (x2+1, y2+1), (136, 150, 0), 2)
            
            cls = int(box.cls[0])
    
            img_pil = Image.fromarray(img)
            draw = ImageDraw.Draw(img_pil)
            
            draw.text((x1, y1),
                      f"[{confidence}%] {class_mapping[cls]}",
                      font=font,
                      fill=(255, 255, 255),
                      stroke_width=1,
                      stroke_fill=(0, 0, 0))
            img = np.array(img_pil)
    
    cv.imwrite(os.path.join(output_dir, os.path.basename(image_path.path)), img)
    #cv.imshow("Photo", img)
    #cv.waitKey(27)         # escape
    #cv.destroyAllWindows()


0: 640x640 1 Glass, 5.3ms
Speed: 2.6ms preprocess, 5.3ms inference, 1.9ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 (no detections), 3.5ms
Speed: 1.4ms preprocess, 3.5ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 (no detections), 5.3ms
Speed: 1.8ms preprocess, 5.3ms inference, 1.1ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 (no detections), 3.1ms
Speed: 1.6ms preprocess, 3.1ms inference, 0.4ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 1 Metal, 3.7ms
Speed: 2.5ms preprocess, 3.7ms inference, 6.5ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 (no detections), 6.2ms
Speed: 2.0ms preprocess, 6.2ms inference, 0.8ms postprocess per image at shape (1, 3, 640, 640)

0: 640x640 (no detections), 2.8ms
Speed: 1.5ms preprocess, 2.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 640)

0: 480x640 1 Plastic, 3.3ms
Speed: 1.3ms preprocess, 3.3ms inference, 0.5ms postprocess per image 