VGGSegmentation

Segmentation vgg16 fcn - cityscapes Priprema skupa

skripta prepare_dataset_downsampled.py

Iz slika cityscapesa izrezuje haubu automobila, i smanjuje sliku na željenu rezoluciju, to zapisuje u tfrecords formatu. Treba zadati putanju do cityscapesa, izlazni direktorij gdje će se spremati tfrecordsi i zadati željenu rezoluciju.

Priprema težina vgg-a

Da bi se model mogao fine-tuneati treba na disku imati spremljene težine mreže (prethodno naučene na nekom drugom skupu). One se mogu skinuti s interneta u raznim formatima.

Ja sam ih imala spremljene u sljedećim datotekama: conv1_1_biases.bin conv1_1_weights.bin conv1_2_biases.bin conv1_2_weights.bin conv2_1_biases.bin conv2_1_weights.bin conv2_2_biases.bin conv2_2_weights.bin conv3_1_biases.bin conv3_1_weights.bin conv3_2_biases.bin conv3_2_weights.bin conv3_3_biases.bin conv3_3_weights.bin conv4_1_biases.bin conv4_1_weights.bin conv4_2_biases.bin conv4_2_weights.bin conv4_3_biases.bin conv4_3_weights.bin conv5_1_biases.bin conv5_1_weights.bin conv5_2_biases.bin conv5_2_weights.bin conv5_3_biases.bin conv5_3_weights.bin fc6_biases.bin fc6_weights.bin fc7_biases.bin fc7_weights.bin fc8_biases.bin fc8_weights.bin

Ako će se težine učitavati iz ckpt. datoteke npr vgg_16.ckpt, onda će i u kodu trebati mjenjati metodu create_init_op unutar model.py

Konfiguracija

config/cityscapes.py - primjer fajla s konfiguracijom za treniranje

Treba promjeniti putanje

model_path da pokazuje do py fajla s definicijom modela (primjer za takve dvije defincije su model.py i model2.py)

dataset_dir - da pokazuje do foldera s prethodno pripremljenim tfrecordsima (koji sadrzi subdirektorije train i val)

treba paziti pri razlicitim rezolucijama da se promjene zastavice img_width i height

ostale zastavice se većinom odnose na treniranje modela to mjenjati prema potrebi.

subsample_factor zastavica bi označavala faktor za koji se rezolucija mape smanji na kraju mreže. Taj faktor će ovisiti o samome modelu koji se trenira, ako model ima tri pooling sloja 2*2 svaki taj sloj će sliku smanjiti za dva puta pa će ukupno smanjnjenje biti za faktor osam

train.py - skripta koja pokreće skriptu treniranja, nakon svake epohe model se evaluira na skupu za validaciju.

Segmentation vgg16 fcn - cityscapes

Related tags

Overview

VGGSegmentation

Segmentation vgg16 fcn - cityscapes Priprema skupa

Priprema težina vgg-a

Konfiguracija

Owner

A testcase generation tool for Persistent Memory Programs.

Fast algorithms to compute an approximation of the minimal volume oriented bounding box of a point cloud in 3D.

Single object tracking and segmentation.

Ranger deep learning optimizer rewrite to use newest components

A PyTorch implementation for PyramidNets (Deep Pyramidal Residual Networks)

A curated list of long-tailed recognition resources.

RealTime Emotion Recognizer for Machine Learning Study Jam's demo

Automatic meme generation model using Tensorflow Keras.

A Closer Look at Invalid Action Masking in Policy Gradient Algorithms

Feed forward VQGAN-CLIP model, where the goal is to eliminate the need for optimizing the latent space of VQGAN for each input prompt

Discovering Dynamic Salient Regions with Spatio-Temporal Graph Neural Networks

Implementation of Kalman Filter in Python

Multi-Target Adversarial Frameworks for Domain Adaptation in Semantic Segmentation

Course on computational design, non-linear optimization, and dynamics of soft systems at UIUC.

Advbox is a toolbox to generate adversarial examples that fool neural networks in PaddlePaddle、PyTorch、Caffe2、MxNet、Keras、TensorFlow and Advbox can benchmark the robustness of machine learning models.

Learning Spatio-Temporal Transformer for Visual Tracking

A trashy useless Latin programming language written in python.

Implementation of 'X-Linear Attention Networks for Image Captioning' [CVPR 2020]

[CVPR 2021] MetaSAug: Meta Semantic Augmentation for Long-Tailed Visual Recognition

Official PyTorch implementation for "Low Precision Decentralized Distributed Training with Heterogenous Data"