From 92b8b5098ebdd845ba5ea54a9b4ee064f4a31ac4 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E6=9D=8E=E6=99=A8?= <lichen@ieemoo.com>
Date: Thu, 21 Sep 2023 18:28:43 +0800
Subject: [PATCH] update

---
 ieemoo-ai-isempty.py | 129 ++++++++++++++++--------------------
 predict.py           |  75 +++++++++------------
 prepara_data.py      | 154 +++++++++++++++++++++++--------------------
 train.py             | 105 ++++++++++++++---------------
 utils/data_utils.py  |   4 +-
 utils/dataset.py     |  14 ++--
 6 files changed, 229 insertions(+), 252 deletions(-)

diff --git a/ieemoo-ai-isempty.py b/ieemoo-ai-isempty.py
index 7093310..ac9877e 100755
--- a/ieemoo-ai-isempty.py
+++ b/ieemoo-ai-isempty.py
@@ -7,14 +7,12 @@ import cv2, base64
 import argparse
 import sys, os
 import torch
+from gevent.pywsgi import WSGIServer
 from PIL import Image
 from torchvision import transforms
-# import logging.config as log_config
+from models.modeling import VisionTransformer, CONFIGS
 sys.path.insert(0, ".")
 
-<<<<<<< HEAD
-#Flask对外服务接口
-=======
 import logging.config
 from skywalking import agent, config
 os.environ["CUDA_VISIBLE_DEVICES"] = "0,1"
@@ -32,64 +30,63 @@ def setup_logging(path):
             logger = logging.getLogger("root")
     return logger
 logger = setup_logging('utils/logging.json')
->>>>>>> develop
 
 
 app = Flask(__name__)
-#app.use_reloader=False
+app.use_reloader=False
 
-print("Autor:ieemoo_lc&ieemoo_lx")
-print(torch.__version__)
 
-def parse_args():
+def parse_args(model_file="../module/ieemoo-ai-isempty/model/now/emptyjudge5_checkpoint.bin"):
+#def parse_args(model_file="output/emptyjudge5_checkpoint.bin"):
     parser = argparse.ArgumentParser()
-    parser.add_argument("--img_size", default=600, type=int, help="Resolution size")
+    parser.add_argument("--img_size", default=448, type=int, help="Resolution size")
     parser.add_argument('--split', type=str, default='overlap', help="Split method")
-    parser.add_argument('--slide_step', type=int, default=2, help="Slide step for overlap split")
+    parser.add_argument('--slide_step', type=int, default=12, help="Slide step for overlap split")
     parser.add_argument('--smoothing_value', type=float, default=0.0, help="Label smoothing value")
-    #使用自定义VIT
-    parser.add_argument("--pretrained_model", type=str, default="../module/ieemoo-ai-isempty/model/now/ieemooempty_vit_checkpoint.pth", help="load pretrained model")
+    parser.add_argument("--pretrained_model", type=str, default=model_file, help="load pretrained model")
     opt, unknown = parser.parse_known_args()
     return opt
 
+
 class Predictor(object):
     def __init__(self, args):
         self.args = args
-        #self.args.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-        #self.args.device = torch.device("cpu")
+        self.args.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         #print(self.args.device)
-        #self.args.nprocs = torch.cuda.device_count()
+        self.args.nprocs = torch.cuda.device_count()
         self.cls_dict = {}
         self.num_classes = 0
         self.model = None
         self.prepare_model()
-        self.test_transform = transforms.Compose([transforms.Resize((600, 600), Image.BILINEAR),
+        self.test_transform = transforms.Compose([transforms.Resize((448, 448), Image.BILINEAR),
                                              transforms.ToTensor(),
                                              transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
 
     def prepare_model(self):
-        # config = CONFIGS["ViT-B_16"]
-        # config.split = self.args.split
-        # config.slide_step = self.args.slide_step
-        # self.num_classes = 5
-        # self.cls_dict = {0: "noemp", 1: "yesemp", 2: "hard", 3: "fly", 4: "stack"}
-        # self.model = VisionTransformer(config, self.args.img_size, zero_head=True, num_classes=self.num_classes, smoothing_value=self.args.smoothing_value)
-        
-        # if self.args.pretrained_model is not None:
-        #     if not torch.cuda.is_available():
-        #         self.model = torch.load(self.args.pretrained_model)
-        #     else:
-        #         self.model = torch.load(self.args.pretrained_model,map_location='cpu')
-        self.model = torch.load(self.args.pretrained_model,map_location=torch.device('cpu'))
+        config = CONFIGS["ViT-B_16"]
+        config.split = self.args.split
+        config.slide_step = self.args.slide_step
+        model_name = os.path.basename(self.args.pretrained_model).replace("_checkpoint.bin", "")
+        #print("use model_name: ", model_name)
+        self.num_classes = 5
+        self.cls_dict = {0: "noemp", 1: "yesemp", 2: "hard", 3: "fly", 4: "stack"}
+        self.model = VisionTransformer(config, self.args.img_size, zero_head=True, num_classes=self.num_classes, smoothing_value=self.args.smoothing_value)
+        if self.args.pretrained_model is not None:
+            if not torch.cuda.is_available():
+                pretrained_model = torch.load(self.args.pretrained_model, map_location=torch.device('cpu'))['model']
+                self.model.load_state_dict(pretrained_model)
+            else:
+                pretrained_model = torch.load(self.args.pretrained_model)['model']
+                self.model.load_state_dict(pretrained_model)
         self.model.eval()
-        if torch.cuda.is_available():
-            self.model.to("cuda")
-        
+        self.model.to(self.args.device)
+        #self.model.eval()
+
     def normal_predict(self, img_data, result):
         # img = Image.open(img_path)
         if img_data is None:
             #print('error, img data is None')
-            print('error, img data is None')
+            logger.warning('error, img data is None')
             return result
         else:
             with torch.no_grad():
@@ -100,59 +97,47 @@ class Predictor(object):
                 probs = torch.nn.Softmax(dim=-1)(part_logits)
                 topN = torch.argsort(probs, dim=-1, descending=True).tolist()
                 clas_ids = topN[0][0]
-
-                print("cur_img result: class id: %d, score: %0.3f" % (clas_ids, probs[0, clas_ids].item()))
-                # if(int(clas_ids)==6 or int(clas_ids)==7):
-                #     clas_ids = 0
-                # else:
-                #     clas_ids = 1
-                # result["success"] = "true"
-                # result["rst_cls"] = str(clas_ids)
-
                 clas_ids = 0 if 0==int(clas_ids) or 2 == int(clas_ids) or 3 == int(clas_ids) else 1
-                print("cur_img result: class id: %d, score: %0.3f" % (clas_ids, probs[0, clas_ids].item()))
+                #print("cur_img result: class id: %d, score: %0.3f" % (clas_ids, probs[0, clas_ids].item()))
                 result["success"] = "true"
                 result["rst_cls"] = str(clas_ids)
-
                 return result
 
 
-
-args = parse_args()
+model_file ="../module/ieemoo-ai-isempty/model/now/emptyjudge5_checkpoint.bin"
+#model_file ="output/emptyjudge5_checkpoint.bin"
+args = parse_args(model_file)
 predictor = Predictor(args)
 
+
 @app.route("/isempty", methods=['POST'])
 def get_isempty():
-    #print("begin")
-
+    start = time.time()
+    #print('--------------------EmptyPredict-----------------')
     data = request.get_data()
+    ip = request.remote_addr
+    #print('------ ip = %s ------' % ip)
+    logger.info(ip)
 
     json_data = json.loads(data.decode("utf-8"))
+    getdateend = time.time()
+    #print('get date use time: {0:.2f}s'.format(getdateend - start))
 
     pic = json_data.get("pic")
-    imgdata = base64.b64decode(pic)
-    
-    result ={}
-    imgdata_np = np.frombuffer(imgdata, dtype='uint8')
-    img_src = cv2.imdecode(imgdata_np, cv2.IMREAD_COLOR)
-    img_data = Image.fromarray(np.uint8(img_src))
-    result = predictor.normal_predict(img_data, result)  # 1==empty, 0==nonEmpty
-   
+    result = {"success": "false",
+              "rst_cls": '-1',
+              }
+    try:
+        imgdata = base64.b64decode(pic)
+        imgdata_np = np.frombuffer(imgdata, dtype='uint8')
+        img_src = cv2.imdecode(imgdata_np, cv2.IMREAD_COLOR)
+        img_data = Image.fromarray(np.uint8(img_src))
+        result = predictor.normal_predict(img_data, result)  # 1==empty, 0==nonEmpty
+    except Exception as e:
+        logger.warning(e)
+        return repr(result)
+    logger.info(repr(result))
     return repr(result)
 
-def getByte(path):
-    with open(path, 'rb') as f:
-        img_byte = base64.b64encode(f.read())
-    img_str = img_byte.decode('utf-8')
-    return img_str
-
 if __name__ == "__main__":
-    app.run(host='0.0.0.0', port=8888)
-
-    # result ={}
-    # imgdata = base64.b64decode(getByte("img.jpg"))
-    # imgdata_np = np.frombuffer(imgdata, dtype='uint8')
-    # img_src = cv2.imdecode(imgdata_np, cv2.IMREAD_COLOR)
-    # img_data = Image.fromarray(np.uint8(img_src))
-    # result = predictor.normal_predict(img_data, result)
-    # print(result)
+    app.run(host='192.168.1.142', port=8000)
diff --git a/predict.py b/predict.py
index f3dabaf..f14096f 100755
--- a/predict.py
+++ b/predict.py
@@ -9,24 +9,22 @@ from sklearn.metrics import f1_score
 from PIL import Image
 from torchvision import transforms
 from models.modeling import VisionTransformer, CONFIGS
-import lightrise
 
-#模型预测
+
 def parse_args():
     parser = argparse.ArgumentParser()
-    parser.add_argument("--img_size", default=600, type=int, help="Resolution size")
+    parser.add_argument("--img_size", default=448, type=int, help="Resolution size")
     parser.add_argument('--split', type=str, default='overlap', help="Split method")  # non-overlap
-    parser.add_argument('--slide_step', type=int, default=2, help="Slide step for overlap split")
+    parser.add_argument('--slide_step', type=int, default=12, help="Slide step for overlap split")
     parser.add_argument('--smoothing_value', type=float, default=0.0, help="Label smoothing value\n")
-    parser.add_argument("--pretrained_model", type=str, default="../module/ieemoo-ai-isempty/model/new/ieemooempty_vit_checkpoint.pth", help="load pretrained model")
-    #parser.add_argument("--pretrained_model", type=str, default="output/ieemooempty_vit_checkpoint.pth", help="load pretrained model") #使用自定义VIT
+    parser.add_argument("--pretrained_model", type=str, default="output/emptyjudge5_checkpoint.bin", help="load pretrained model")
     return parser.parse_args()
 
 
 class Predictor(object):
     def __init__(self, args):
         self.args = args
-        self.args.device = torch.device("cuda")
+        self.args.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
         print("self.args.device =", self.args.device)
         self.args.nprocs = torch.cuda.device_count()
 
@@ -34,7 +32,7 @@ class Predictor(object):
         self.num_classes = 0
         self.model = None
         self.prepare_model()
-        self.test_transform = transforms.Compose([transforms.Resize((600, 600), Image.BILINEAR),
+        self.test_transform = transforms.Compose([transforms.Resize((448, 448), Image.BILINEAR),
                                              transforms.ToTensor(),
                                              transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
 
@@ -42,14 +40,28 @@ class Predictor(object):
         config = CONFIGS["ViT-B_16"]
         config.split = self.args.split
         config.slide_step = self.args.slide_step
-        self.num_classes = 5
-        self.cls_dict = {0: "noemp", 1: "yesemp"}
-
+        model_name = os.path.basename(self.args.pretrained_model).replace("_checkpoint.bin", "")
+        print("use model_name: ", model_name)
+        if model_name.lower() == "emptyJudge5".lower():
+            self.num_classes = 5
+            self.cls_dict = {0: "noemp", 1: "yesemp", 2: "hard", 3: "fly", 4: "stack"}
+        elif model_name.lower() == "emptyJudge4".lower():
+            self.num_classes = 4
+            self.cls_dict = {0: "noemp", 1: "yesemp", 2: "hard", 3: "stack"}
+        elif model_name.lower() == "emptyJudge3".lower():
+            self.num_classes = 3
+            self.cls_dict = {0: "noemp", 1: "yesemp", 2: "hard"}
+        elif model_name.lower() == "emptyJudge2".lower():
+            self.num_classes = 2
+            self.cls_dict = {0: "noemp", 1: "yesemp"}
         self.model = VisionTransformer(config, self.args.img_size, zero_head=True, num_classes=self.num_classes, smoothing_value=self.args.smoothing_value)
-        
         if self.args.pretrained_model is not None:
-            self.model = torch.load(self.args.pretrained_model,map_location='cpu')
-        
+            if not torch.cuda.is_available():
+                pretrained_model = torch.load(self.args.pretrained_model, map_location=torch.device('cpu'))['model']
+                self.model.load_state_dict(pretrained_model)
+            else:
+                pretrained_model = torch.load(self.args.pretrained_model)['model']
+                self.model.load_state_dict(pretrained_model)
         self.model.to(self.args.device)
         self.model.eval()
 
@@ -61,7 +73,9 @@ class Predictor(object):
                 "Image file failed to read: {}".format(img_path))
         else:
             x = self.test_transform(img)
-            part_logits = self.model(x.unsqueeze(0).to(args.device))
+            if torch.cuda.is_available():
+                x = x.cuda()
+            part_logits = self.model(x.unsqueeze(0))
             probs = torch.nn.Softmax(dim=-1)(part_logits)
             topN = torch.argsort(probs, dim=-1, descending=True).tolist()
             clas_ids = topN[0][0]
@@ -75,12 +89,8 @@ if __name__ == "__main__":
 
     y_true = []
     y_pred = []
-    test_dir = "./emptyJudge5/images/"
+    test_dir = "/data/pfc/fineGrained/test_5cls"
     dir_dict = {"noemp":"0", "yesemp":"1", "hard": "2", "fly": "3", "stack": "4"}
-    
-    # test_dir = "../emptyJudge2/images"
-    # dir_dict = {"noempty":"0", "empty":"1"}
-
     total = 0
     num = 0
     t0 = time.time()
@@ -96,19 +106,6 @@ if __name__ == "__main__":
             cur_pred, pred_score = predictor.normal_predict(cur_img_file)
 
             label = 0 if 2 == int(label) or 3 == int(label) or 4 == int(label) else int(label)
-
-            riseresult = lightrise.riseempty(Image.open(cur_img_file))
-            if(label==1):
-                if(int(riseresult["rst_cls"])==1):
-                    label=1
-                else:
-                    label=0
-            # else:
-            #     if(riseresult["rst_cls"]==0):
-            #         label=0
-            #     else:
-            #         label=1
-
             cur_pred = 0 if 2 == int(cur_pred) or 3 == int(cur_pred) or 4 == int(cur_pred) else int(cur_pred)
             y_true.append(int(label))
             y_pred.append(int(cur_pred))
@@ -128,18 +125,6 @@ if __name__ == "__main__":
     print(rst_C)
     print(rst_f1)
 
-'''
-所有数据集
-
-The cast of time is :160.738966 seconds
-The classification accuracy is 0.986836
-[[4923   58]
- [  34 1974]]
-0.9839851634589902
-
-'''
-
-
 '''
 test_imgs: yesemp=145, noemp=453  大图
 
diff --git a/prepara_data.py b/prepara_data.py
index 7aa0e40..1d779d5 100755
--- a/prepara_data.py
+++ b/prepara_data.py
@@ -1,38 +1,28 @@
-#encoding: utf-8
 import os
+import cv2
 import numpy as np
 import subprocess
 import random
 
 
-#生成数据集
-
-
 # ----------- 改写名称 --------------
 # index = 0
-# src_dir = "../emptyJudge2/images/"
-# dst_dir = src_dir 
-# os.remove('../emptyJudge2/image_class_labels.txt')
-# os.remove('../emptyJudge2/images.txt')
-# os.remove('../emptyJudge2/train_test_split.txt')
-# if(os.path.exists(dst_dir)):
-#     pass
-# else:
-#     os.makedirs(dst_dir)
-
+# src_dir = "/data/fineGrained/emptyJudge5"
+# dst_dir = src_dir + "_new"
+# os.makedirs(dst_dir, exist_ok=True)
 # for sub in os.listdir(src_dir):
 #     sub_path = os.path.join(src_dir, sub)
-#     print(sub_path)
 #     sub_path_dst = os.path.join(dst_dir, sub)
+#     os.makedirs(sub_path_dst, exist_ok=True)
 #     for cur_f in os.listdir(sub_path):
 #         cur_img = os.path.join(sub_path, cur_f)
-#         cur_img_dst = os.path.join(sub_path_dst, "image%04d.jpg" % index)
+#         cur_img_dst = os.path.join(sub_path_dst, "a%05d.jpg" % index)
 #         index += 1
 #         os.system("mv %s %s" % (cur_img, cur_img_dst))
 
 
 # ----------- 删除过小图像 --------------
-# src_dir = "../emptyJudge2/images/"
+# src_dir = "/data/fineGrained/emptyJudge5"
 # for sub in os.listdir(src_dir):
 #     sub_path = os.path.join(src_dir, sub)
 #     for cur_f in os.listdir(sub_path):
@@ -47,59 +37,83 @@ import random
 
 
 # ----------- 获取有效图片并写images.txt --------------
-src_dir = "../emptyJudge2/images/"
-src_dict = {"noempty":"0", "empty":"1"}
-all_dict = {"noempty":[], "empty":[]}
-for sub, value in src_dict.items():
-    sub_path = os.path.join(src_dir, sub)
-    for cur_f in os.listdir(sub_path):
-        all_dict[sub].append(os.path.join(sub, cur_f))
-
-yesnum = len(all_dict["empty"])
-#print(yesnum)
-nonum = len(all_dict["noempty"])
-#print(nonum)
-images_txt = "../emptyJudge2/images.txt"
-index = 0
-
-
-def write_images(cur_list, num, fw, index):
-    for feat_path in random.sample(cur_list, num):
-        fw.write(str(index) + " " + feat_path + "\n")
-        index += 1
-    return index
-
-with open(images_txt, "w") as fw:
-    index = write_images(all_dict["noempty"], nonum, fw, index)
-    index = write_images(all_dict["empty"], yesnum, fw, index)
-    
-    
+# src_dir = "/data/fineGrained/emptyJudge4/images"
+# src_dict = {"noemp":"0", "yesemp":"1", "hard": "2", "stack": "3"}
+# all_dict = {"yesemp":[], "noemp":[], "hard": [], "stack": []}
+# for sub, value in src_dict.items():
+#     sub_path = os.path.join(src_dir, sub)
+#     for cur_f in os.listdir(sub_path):
+#         all_dict[sub].append(os.path.join(sub, cur_f))
+#
+# yesnum = len(all_dict["yesemp"])
+# nonum = len(all_dict["noemp"])
+# hardnum = len(all_dict["hard"])
+# stacknum = len(all_dict["stack"])
+# thnum = min(yesnum, nonum, hardnum, stacknum)
+# images_txt = src_dir + ".txt"
+# index = 1
+#
+# def write_images(cur_list, thnum, fw, index):
+#     for feat_path in random.sample(cur_list, thnum):
+#         fw.write(str(index) + " " + feat_path + "\n")
+#         index += 1
+#     return index
+#
+# with open(images_txt, "w") as fw:
+#     index = write_images(all_dict["noemp"], thnum, fw, index)
+#     index = write_images(all_dict["yesemp"], thnum, fw, index)
+#     index = write_images(all_dict["hard"], thnum, fw, index)
+#     index = write_images(all_dict["stack"], thnum, fw, index)
 
 # ----------- 写 image_class_labels.txt + train_test_split.txt --------------
-src_dir = "../emptyJudge2/"
-src_dict = {"noempty":"0", "empty":"1"}
-images_txt = os.path.join(src_dir, "images.txt")
-image_class_labels_txt = os.path.join(src_dir, "image_class_labels.txt")
-imgs_cnt = 0
-with open(image_class_labels_txt, "w") as fw:
-    with open(images_txt, "r") as fr:
-        for cur_l in fr:
-            imgs_cnt += 1
-            img_index, img_f = cur_l.strip().split(" ")
-            folder_name = img_f.split("/")[0]
-            if folder_name in src_dict:
-                cur_line = img_index + " " + str(int(src_dict[folder_name])+1)
-                fw.write(cur_line + "\n")
+# src_dir = "/data/fineGrained/emptyJudge4"
+# src_dict = {"noemp":"0", "yesemp":"1", "hard": "2", "stack": "3"}
+# images_txt = os.path.join(src_dir, "images.txt")
+# image_class_labels_txt = os.path.join(src_dir, "image_class_labels.txt")
+# imgs_cnt = 0
+# with open(image_class_labels_txt, "w") as fw:
+#     with open(images_txt, "r") as fr:
+#         for cur_l in fr:
+#             imgs_cnt += 1
+#             img_index, img_f = cur_l.strip().split(" ")
+#             folder_name = img_f.split("/")[0]
+#             if folder_name in src_dict:
+#                 cur_line = img_index + " " + str(int(src_dict[folder_name])+1)
+#                 fw.write(cur_line + "\n")
+#
+# train_num = int(imgs_cnt*0.85)
+# print("train_num= ", train_num, ", imgs_cnt= ", imgs_cnt)
+# all_list = [1]*train_num + [0]*(imgs_cnt-train_num)
+# assert len(all_list) == imgs_cnt
+# random.shuffle(all_list)
+# train_test_split_txt = os.path.join(src_dir, "train_test_split.txt")
+# with open(train_test_split_txt, "w") as fw:
+#     with open(images_txt, "r") as fr:
+#         for cur_l in fr:
+#             img_index, img_f = cur_l.strip().split(" ")
+#             cur_line = img_index + " " + str(all_list[int(img_index) - 1])
+#             fw.write(cur_line + "\n")
+
+# ----------- 生成标准测试集 --------------
+# src_dir = "/data/fineGrained/emptyJudge5/images"
+# src_dict = {"noemp":"0", "yesemp":"1", "hard": "2", "fly": "3", "stack": "4"}
+# all_dict = {"noemp":[],  "yesemp":[], "hard": [],  "fly": [], "stack": []}
+# for sub, value in src_dict.items():
+#     sub_path = os.path.join(src_dir, sub)
+#     for cur_f in os.listdir(sub_path):
+#         all_dict[sub].append(cur_f)
+#
+# dst_dir = src_dir + "_test"
+# os.makedirs(dst_dir, exist_ok=True)
+# for sub, value in src_dict.items():
+#     sub_path = os.path.join(src_dir, sub)
+#     sub_path_dst = os.path.join(dst_dir, sub)
+#     os.makedirs(sub_path_dst, exist_ok=True)
+#
+#     cur_list = all_dict[sub]
+#     test_num = int(len(cur_list) * 0.05)
+#     for cur_f in random.sample(cur_list, test_num):
+#         cur_path = os.path.join(sub_path, cur_f)
+#         cur_path_dst = os.path.join(sub_path_dst, cur_f)
+#         os.system("cp %s %s" % (cur_path, cur_path_dst))
 
-train_num = int(imgs_cnt*0.85)
-print("train_num= ", train_num, ", imgs_cnt= ", imgs_cnt)
-all_list = [1]*train_num + [0]*(imgs_cnt-train_num)
-assert len(all_list) == imgs_cnt
-random.shuffle(all_list)
-train_test_split_txt = os.path.join(src_dir, "train_test_split.txt")
-with open(train_test_split_txt, "w") as fw:
-    with open(images_txt, "r") as fr:
-        for cur_l in fr:
-            img_index, img_f = cur_l.strip().split(" ")
-            cur_line = img_index + " " + str(all_list[int(img_index) - 1])
-            fw.write(cur_line + "\n")
diff --git a/train.py b/train.py
index ebdd2bb..90a7b21 100755
--- a/train.py
+++ b/train.py
@@ -24,9 +24,7 @@ import pdb
 
 logger = logging.getLogger(__name__)
 
-os.environ["CUDA_VISIBLE_DEVICES"] = "0"
-
-#计算并存储平均值
+os.environ["CUDA_VISIBLE_DEVICES"] = "0,1,2"
 class AverageMeter(object):
     """Computes and stores the average and current value"""
     def __init__(self):
@@ -44,24 +42,19 @@ class AverageMeter(object):
         self.count += n
         self.avg = self.sum / self.count
 
-#简单准确率
+
 def simple_accuracy(preds, labels):
     return (preds == labels).mean()
 
-#求均值
+
 def reduce_mean(tensor, nprocs):
     rt = tensor.clone()
     dist.all_reduce(rt, op=dist.ReduceOp.SUM)
     rt /= nprocs
     return rt
 
-#保存模型
+
 def save_model(args, model):
-<<<<<<< HEAD
-    model_checkpoint = os.path.join("../module/ieemoo-ai-isempty/model/now/emptyjudge5_checkpoint.bin")
-    torch.save(model, model_checkpoint)
-    logger.info("Saved model checkpoint to [File: %s]", "../module/ieemoo-ai-isempty/model/now/emptyjudge5_checkpoint.bin")
-=======
     model_to_save = model.module if hasattr(model, 'module') else model
     model_checkpoint = os.path.join(args.output_dir, "%s_checkpoint.bin" % args.name)
     checkpoint = {
@@ -79,24 +72,36 @@ def save_eve_model(args, model, eve_name):
     torch.save(checkpoint, model_checkpoint)
     logger.info("Saved model checkpoint to [DIR: %s]", args.output_dir)
 
->>>>>>> develop
 
-#根据数据集配置模型
 def setup(args):
     # Prepare model
     config = CONFIGS[args.model_type]
     config.split = args.split
     config.slide_step = args.slide_step
-   
-    if args.dataset == "emptyJudge5":
+
+    if args.dataset == "CUB_200_2011":
+        num_classes = 200
+    elif args.dataset == "car":
+        num_classes = 196
+    elif args.dataset == "nabirds":
+        num_classes = 555
+    elif args.dataset == "dog":
+        num_classes = 120
+    elif args.dataset == "INat2017":
+        num_classes = 5089
+    elif args.dataset == "emptyJudge5":
         num_classes = 5
-   
+    elif args.dataset == "emptyJudge4":
+        num_classes = 4
+    elif args.dataset == "emptyJudge3":
+        num_classes = 3
+
     model = VisionTransformer(config, args.img_size, zero_head=True, num_classes=num_classes, smoothing_value=args.smoothing_value)
 
-    if args.pretrained_dir is not None:
-        model.load_from(np.load(args.pretrained_dir)) #他人预训练模型
+    model.load_from(np.load(args.pretrained_dir))
     if args.pretrained_model is not None:
-        model = torch.load(args.pretrained_model) #自己预训练模型
+        pretrained_model = torch.load(args.pretrained_model)['model']
+        model.load_state_dict(pretrained_model)
     #model.to(args.device)
     #pdb.set_trace()
     num_params = count_parameters(model)
@@ -104,15 +109,15 @@ def setup(args):
     logger.info("{}".format(config))
     logger.info("Training parameters %s", args)
     logger.info("Total Parameter: \t%2.1fM" % num_params)
-    model = torch.nn.DataParallel(model, device_ids=[0]).cuda()
+    model = torch.nn.DataParallel(model, device_ids=[0,1]).cuda()
     return args, model
 
-#计算模型参数数量
+
 def count_parameters(model):
     params = sum(p.numel() for p in model.parameters() if p.requires_grad)
     return params/1000000
 
-#随机种子
+
 def set_seed(args):
     random.seed(args.seed)
     np.random.seed(args.seed)
@@ -120,7 +125,7 @@ def set_seed(args):
     if args.n_gpu > 0:
         torch.cuda.manual_seed_all(args.seed)
 
-#模型验证
+
 def valid(args, model, writer, test_loader, global_step):
     eval_losses = AverageMeter()
 
@@ -177,7 +182,7 @@ def valid(args, model, writer, test_loader, global_step):
         writer.add_scalar("test/accuracy", scalar_value=val_accuracy, global_step=global_step)
     return val_accuracy
 
-#模型训练
+
 def train(args, model):
     """ Train the model """
     if args.local_rank in [-1, 0]:
@@ -293,54 +298,37 @@ def train(args, model):
     end_time = time.time()
     logger.info("Total Training Time: \t%f" % ((end_time - start_time) / 3600))
 
-    
 
-#主函数
 def main():
     parser = argparse.ArgumentParser()
     # Required parameters
-    parser.add_argument("--name", type=str, default='ieemooempty',
+    parser.add_argument("--name", required=True,
                         help="Name of this run. Used for monitoring.")
     parser.add_argument("--dataset", choices=["CUB_200_2011", "car", "dog", "nabirds", "INat2017", "emptyJudge5", "emptyJudge4"],
-<<<<<<< HEAD
-                        default="emptyJudge5", help="Which dataset.")
-    parser.add_argument('--data_root', type=str, default='./')
-=======
                         default="CUB_200_2011", help="Which dataset.")
     parser.add_argument('--data_root', type=str, default='/data/pfc/fineGrained')
->>>>>>> develop
     parser.add_argument("--model_type", choices=["ViT-B_16", "ViT-B_32", "ViT-L_16", "ViT-L_32", "ViT-H_14"],
                         default="ViT-B_16",help="Which variant to use.")
-    parser.add_argument("--pretrained_dir", type=str, default="./preckpts/ViT-B_16.npz",
+    parser.add_argument("--pretrained_dir", type=str, default="ckpts/ViT-B_16.npz",
                         help="Where to search for pretrained ViT models.")
-    #parser.add_argument("--pretrained_model", type=str, default="./output/ieemooempty_checkpoint_good.pth", help="load pretrained model") #None
-    # parser.add_argument("--pretrained_dir", type=str, default=None,
-    #                     help="Where to search for pretrained ViT models.")
-    parser.add_argument("--pretrained_model", type=str, default=None, help="load pretrained model") #None
+    parser.add_argument("--pretrained_model", type=str, default="output/emptyjudge5_checkpoint.bin", help="load pretrained model")
+    #parser.add_argument("--pretrained_model", type=str, default=None, help="load pretrained model")
     parser.add_argument("--output_dir", default="./output", type=str,
                         help="The output directory where checkpoints will be written.")
-    parser.add_argument("--img_size", default=600, type=int, help="Resolution size")
-    parser.add_argument("--train_batch_size", default=8, type=int,
+    parser.add_argument("--img_size", default=448, type=int, help="Resolution size")
+    parser.add_argument("--train_batch_size", default=64, type=int,
                         help="Total batch size for training.")
-    parser.add_argument("--eval_batch_size", default=8, type=int,
+    parser.add_argument("--eval_batch_size", default=16, type=int,
                         help="Total batch size for eval.")
-<<<<<<< HEAD
-    parser.add_argument("--eval_every", default=786, type=int,
-=======
     parser.add_argument("--eval_every", default=200, type=int, #200
->>>>>>> develop
                         help="Run prediction on validation set every so many steps."
                              "Will always run one evaluation at the end of training.")
 
-    parser.add_argument("--learning_rate", default=3e-2, type=float, 
+    parser.add_argument("--learning_rate", default=3e-2, type=float,
                         help="The initial learning rate for SGD.")
-    parser.add_argument("--weight_decay", default=0.00001, type=float,
+    parser.add_argument("--weight_decay", default=0, type=float,
                         help="Weight deay if we apply some.")
-<<<<<<< HEAD
-    parser.add_argument("--num_steps", default=78600, type=int,    #100000
-=======
     parser.add_argument("--num_steps", default=40000, type=int,    #100000
->>>>>>> develop
                         help="Total number of training epochs to perform.")
     parser.add_argument("--decay_type", choices=["cosine", "linear"], default="cosine",
                         help="How to decay the learning rate.")
@@ -355,6 +343,15 @@ def main():
                         help="random seed for initialization")
     parser.add_argument('--gradient_accumulation_steps', type=int, default=1,
                         help="Number of updates steps to accumulate before performing a backward/update pass.")
+    parser.add_argument('--fp16', action='store_true',
+                        help="Whether to use 16-bit float precision instead of 32-bit")
+    parser.add_argument('--fp16_opt_level', type=str, default='O2',
+                        help="For fp16: Apex AMP optimization level selected in ['O0', 'O1', 'O2', and 'O3']."
+                             "See details at https://nvidia.github.io/apex/amp.html")
+    parser.add_argument('--loss_scale', type=float, default=0,
+                        help="Loss scaling to improve fp16 numeric stability. Only used when fp16 set to True.\n"
+                             "0 (default value): dynamic loss scaling.\n"
+                             "Positive power of 2: static loss scaling value.\n")
 
     parser.add_argument('--smoothing_value', type=float, default=0.0, help="Label smoothing value\n")
 
@@ -366,10 +363,7 @@ def main():
     # Setup CUDA, GPU & distributed training
     if args.local_rank == -1:
         device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-<<<<<<< HEAD
-=======
         #print('torch.cuda.device_count()>>>>>>>>>>>>>>>>>>>>>>>>>', torch.cuda.device_count())
->>>>>>> develop
         args.n_gpu = torch.cuda.device_count()
         #print('torch.cuda.device_count()>>>>>>>>>>>>>>>>>>>>>>>>>', torch.cuda.device_count()) 
     else:  # Initializes the distributed backend which will take care of sychronizing nodes/GPUs
@@ -384,8 +378,8 @@ def main():
     logging.basicConfig(format='%(asctime)s - %(levelname)s - %(name)s - %(message)s',
                         datefmt='%m/%d/%Y %H:%M:%S',
                         level=logging.INFO if args.local_rank in [-1, 0] else logging.WARN)
-    logger.warning("Process rank: %s, device: %s, n_gpu: %s, distributed training: %s" %
-                   (args.local_rank, args.device, args.n_gpu, bool(args.local_rank != -1)))
+    logger.warning("Process rank: %s, device: %s, n_gpu: %s, distributed training: %s, 16-bits training: %s" %
+                   (args.local_rank, args.device, args.n_gpu, bool(args.local_rank != -1), args.fp16))
 
     # Set seed
     set_seed(args)
@@ -397,5 +391,4 @@ def main():
 
 
 if __name__ == "__main__":
-    torch.cuda.empty_cache()
     main()
diff --git a/utils/data_utils.py b/utils/data_utils.py
index 9ecfe0c..86df2a9 100755
--- a/utils/data_utils.py
+++ b/utils/data_utils.py
@@ -101,7 +101,7 @@ def get_loader(args):
         testset = INat2017(args.data_root, 'val', test_transform)
     elif args.dataset == 'emptyJudge5' or args.dataset == 'emptyJudge4':
         train_transform = transforms.Compose([transforms.Resize((600, 600), Image.BILINEAR),
-                                    transforms.RandomCrop((320, 320)),
+                                    transforms.RandomCrop((448, 448)),
                                     transforms.RandomHorizontalFlip(),
                                     transforms.ToTensor(),
                                     transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
@@ -109,7 +109,7 @@ def get_loader(args):
         #                             transforms.CenterCrop((448, 448)),
         #                             transforms.ToTensor(),
         #                             transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
-        test_transform = transforms.Compose([transforms.Resize((320, 320), Image.BILINEAR),
+        test_transform = transforms.Compose([transforms.Resize((448, 448), Image.BILINEAR),
                                     transforms.ToTensor(),
                                     transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
         trainset = emptyJudge(root=args.data_root, is_train=True, transform=train_transform)
diff --git a/utils/dataset.py b/utils/dataset.py
index 0381dc3..7a06567 100755
--- a/utils/dataset.py
+++ b/utils/dataset.py
@@ -5,7 +5,7 @@ from os.path import join
 import numpy as np
 import scipy
 from scipy import io
-import imageio
+import scipy.misc
 from PIL import Image
 import pandas as pd
 import matplotlib.pyplot as plt
@@ -16,7 +16,7 @@ from torchvision.datasets import VisionDataset
 from torchvision.datasets.folder import default_loader
 from torchvision.datasets.utils import download_url, list_dir, check_integrity, extract_archive, verify_str_arg
 
-#对各种数据集的底层读取
+
 class emptyJudge():
     def __init__(self, root, is_train=True, data_len=None, transform=None):
         self.root = root
@@ -37,12 +37,12 @@ class emptyJudge():
         train_file_list = [x for i, x in zip(train_test_list, img_name_list) if i]
         test_file_list = [x for i, x in zip(train_test_list, img_name_list) if not i]
         if self.is_train:
-            self.train_img = [imageio.imread(os.path.join(self.root, 'images', train_file)) for train_file in
+            self.train_img = [scipy.misc.imread(os.path.join(self.root, 'images', train_file)) for train_file in
                               train_file_list[:data_len]]
             self.train_label = [x for i, x in zip(train_test_list, label_list) if i][:data_len]
             self.train_imgname = [x for x in train_file_list[:data_len]]
         if not self.is_train:
-            self.test_img = [imageio.imread(os.path.join(self.root, 'images', test_file)) for test_file in
+            self.test_img = [scipy.misc.imread(os.path.join(self.root, 'images', test_file)) for test_file in
                              test_file_list[:data_len]]
             self.test_label = [x for i, x in zip(train_test_list, label_list) if not i][:data_len]
             self.test_imgname = [x for x in test_file_list[:data_len]]
@@ -51,7 +51,7 @@ class emptyJudge():
         if self.is_train:
             img, target, imgname = self.train_img[index], self.train_label[index], self.train_imgname[index]
             if len(img.shape) == 2:
-                img = np.stack([img] * 3, 2) #拼接为三维数组，[3,width,highth]
+                img = np.stack([img] * 3, 2)
             img = Image.fromarray(img, mode='RGB')
             if self.transform is not None:
                 img = self.transform(img)
@@ -91,12 +91,12 @@ class CUB():
         train_file_list = [x for i, x in zip(train_test_list, img_name_list) if i]
         test_file_list = [x for i, x in zip(train_test_list, img_name_list) if not i]
         if self.is_train:
-            self.train_img = [imageio.imread(os.path.join(self.root, 'images', train_file)) for train_file in
+            self.train_img = [scipy.misc.imread(os.path.join(self.root, 'images', train_file)) for train_file in
                               train_file_list[:data_len]]
             self.train_label = [x for i, x in zip(train_test_list, label_list) if i][:data_len]
             self.train_imgname = [x for x in train_file_list[:data_len]]
         if not self.is_train:
-            self.test_img = [imageio.imread(os.path.join(self.root, 'images', test_file)) for test_file in
+            self.test_img = [scipy.misc.imread(os.path.join(self.root, 'images', test_file)) for test_file in
                              test_file_list[:data_len]]
             self.test_label = [x for i, x in zip(train_test_list, label_list) if not i][:data_len]
             self.test_imgname = [x for x in test_file_list[:data_len]]