New Excel writer.

2024-05-06 14:51:47 -05:00
parent 61c1a613e2
commit f30f6403d6
10 changed files with 1003 additions and 430 deletions
--- a/src/submissions/backend/db/models/kits.py
+++ b/src/submissions/backend/db/models/kits.py
@@ -2,13 +2,16 @@
 All kit and reagent related models
 '''
 from __future__ import annotations
+
+from copy import copy
+
 from sqlalchemy import Column, String, TIMESTAMP, JSON, INTEGER, ForeignKey, Interval, Table, FLOAT, BLOB
 from sqlalchemy.orm import relationship, validates, Query
 from sqlalchemy.ext.associationproxy import association_proxy
 from datetime import date
 import logging, re
 from tools import check_authorization, setup_lookup, Report, Result
-from typing import List
+from typing import List, Literal
 from pandas import ExcelFile
 from pathlib import Path
 from . import Base, BaseClass, Organization
@@ -129,7 +132,8 @@ class KitType(BaseClass):
            return [item.reagent_type for item in relevant_associations if item.required == 1]
        else:
            return [item.reagent_type for item in relevant_associations]
-    
+
+    # TODO: Move to BasicSubmission?
    def construct_xl_map_for_use(self, submission_type:str|SubmissionType) -> dict:
        """
        Creates map of locations in excel workbook for a SubmissionType
@@ -159,11 +163,12 @@ class KitType(BaseClass):
                map[assoc.reagent_type.name] = assoc.uses
            except TypeError:
                continue
-        # Get SubmissionType info map
-        try:
-            map['info'] = st_assoc.info_map
-        except IndexError as e:
-            map['info'] = {}
+        # # Get SubmissionType info map
+        # try:
+        #     # map['info'] = st_assoc.info_map
+        #     map['info'] = st_assoc.construct_info_map(mode="write")
+        # except IndexError as e:
+        #     map['info'] = {}
        return map

    @classmethod
@@ -551,7 +556,8 @@ class SubmissionType(BaseClass):
    instances = relationship("BasicSubmission", backref="submission_type") #: Concrete instances of this type.
    template_file = Column(BLOB) #: Blank form for this type stored as binary.
    processes = relationship("Process", back_populates="submission_types", secondary=submissiontypes_processes) #: Relation to equipment processes used for this type.
-    
+    sample_map = Column(JSON) #: Where sample information is found in the excel sheet corresponding to this type.
+
    submissiontype_kit_associations = relationship(
        "SubmissionTypeKitTypeAssociation",
        back_populates="submission_type",
@@ -612,24 +618,40 @@ class SubmissionType(BaseClass):
        self.template_file = data
        self.save()        

-    def construct_equipment_map(self) -> List[dict]:
+    def construct_info_map(self, mode:Literal['read', 'write']) -> dict:
+        info = self.info_map
+        logger.debug(f"Info map: {info}")
+        output = {}
+        # for k,v in info.items():
+            # info[k]['write'] += info[k]['read']
+        match mode:
+            case "read":
+                output = {k:v[mode] for k,v in info.items() if v[mode]}
+            case "write":
+                output = {k:v[mode] + v['read'] for k,v in info.items() if v[mode] or v['read']}
+        return output
+
+    def construct_sample_map(self):
+        return self.sample_map
+
+    def construct_equipment_map(self) -> dict:
        """
        Constructs map of equipment to excel cells.

        Returns:
            List[dict]: List of equipment locations in excel sheet
        """
-        output = []
+        output = {}
        # logger.debug("Iterating through equipment roles")
        for item in self.submissiontype_equipmentrole_associations:
            map = item.uses
-            if map == None:
+            if map is None:
                map = {}
-            try:
-                map['role'] = item.equipment_role.name
-            except TypeError:
-                pass
-            output.append(map)
+            # try:
+            output[item.equipment_role.name] = map
+            # except TypeError:
+            #     pass
+            # output.append(map)
        return output

    def get_equipment(self, extraction_kit:str|KitType|None=None) -> List['PydEquipmentRole']:
--- a/src/submissions/backend/db/models/submissions.py
+++ b/src/submissions/backend/db/models/submissions.py
@@ -112,6 +112,14 @@ class BasicSubmission(BaseClass):
            output += BasicSubmission.jsons()
        return output

+    @classmethod
+    def timestamps(cls) -> List[str]:
+        output = [item.name for item in cls.__table__.columns if isinstance(item.type, TIMESTAMP)]
+        if issubclass(cls, BasicSubmission) and not cls.__name__ == "BasicSubmission":
+            output += BasicSubmission.timestamps()
+        return output
+
+    # TODO: Beef up this to include info_map from DB
    @classmethod
    def get_default_info(cls, *args):
        # Create defaults for all submission_types
@@ -121,16 +129,18 @@ class BasicSubmission(BaseClass):
            details_ignore=['excluded', 'reagents', 'samples',
                            'extraction_info', 'comment', 'barcode',
                            'platemap', 'export_map', 'equipment'],
-            form_recover=recover,
+            # NOTE: Fields not placed in ui form
            form_ignore=['reagents', 'ctx', 'id', 'cost', 'extraction_info', 'signed_by', 'comment'] + recover,
-            parser_ignore=['samples', 'signed_by'] + cls.jsons(),
-            excel_ignore=[],
+            # NOTE: Fields not placed in ui form to be moved to pydantic
+            form_recover=recover,
+            # parser_ignore=['samples', 'signed_by'] + [item for item in cls.jsons() if item != "comment"],
+            # excel_ignore=[],
        )
        # logger.debug(dicto['singles'])
-        """Singles tells the query which fields to set limit to 1"""
+        # NOTE: Singles tells the query which fields to set limit to 1
        dicto['singles'] = parent_defs['singles']
        # logger.debug(dicto['singles'])
-        """Grab subtype specific info."""
+        # NOTE: Grab subtype specific info.
        output = {}
        for k, v in dicto.items():
            if len(args) > 0 and k not in args:
@@ -163,6 +173,14 @@ class BasicSubmission(BaseClass):
        name = cls.__mapper_args__['polymorphic_identity']
        return SubmissionType.query(name=name)

+    @classmethod
+    def construct_info_map(cls, mode:Literal['read', 'write']):
+        return cls.get_submission_type().construct_info_map(mode=mode)
+
+    @classmethod
+    def construct_sample_map(cls):
+        return cls.get_submission_type().construct_sample_map()
+
    def to_dict(self, full_data: bool = False, backup: bool = False, report: bool = False) -> dict:
        """
        Constructs dictionary used in submissions summary
@@ -492,7 +510,6 @@ class BasicSubmission(BaseClass):
            missing = value is None or value in ['', 'None']
            match key:
                case "reagents":
-
                    new_dict[key] = [PydReagent(**reagent) for reagent in value]
                case "samples":
                    new_dict[key] = [PydSample(**{k.lower().replace(" ", "_"): v for k, v in sample.items()}) for sample
@@ -506,6 +523,8 @@ class BasicSubmission(BaseClass):
                    new_dict['rsl_plate_num'] = dict(value=value, missing=missing)
                case "Submitter Plate Number":
                    new_dict['submitter_plate_num'] = dict(value=value, missing=missing)
+                case "id":
+                    pass
                case _:
                    logger.debug(f"Setting dict {key} to {value}")
                    new_dict[key.lower().replace(" ", "_")] = dict(value=value, missing=missing)
@@ -601,7 +620,7 @@ class BasicSubmission(BaseClass):
        return plate_map

    @classmethod
-    def parse_info(cls, input_dict: dict, xl: pd.ExcelFile | None = None) -> dict:
+    def parse_info(cls, input_dict: dict, xl: Workbook | None = None) -> dict:
        """
        Update submission dictionary with type specific information

@@ -630,8 +649,7 @@ class BasicSubmission(BaseClass):
        return input_dict

    @classmethod
-    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None,
-                       plate_map: dict | None = None) -> dict:
+    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None) -> dict:
        """
        Performs any final custom parsing of the excel file.

@@ -999,7 +1017,7 @@ class BasicSubmission(BaseClass):
        fname = self.__backup_path__.joinpath(f"{self.rsl_plate_num}-backup({date.today().strftime('%Y%m%d')})")
        msg = QuestionAsker(title="Delete?", message=f"Are you sure you want to delete {self.rsl_plate_num}?\n")
        if msg.exec():
-            self.backup(fname=fname, full_backup=True)
+            # self.backup(fname=fname, full_backup=True)
            self.__database_session__.delete(self)
            try:
                self.__database_session__.commit()
@@ -1083,6 +1101,7 @@ class BasicSubmission(BaseClass):
        if fname.name == "":
            logger.debug(f"export cancelled.")
            return
+        # pyd.filepath = fname
        if full_backup:
            backup = self.to_dict(full_data=True)
            try:
@@ -1090,11 +1109,12 @@ class BasicSubmission(BaseClass):
                    yaml.dump(backup, f)
            except KeyError as e:
                logger.error(f"Problem saving yml backup file: {e}")
-        wb = pyd.autofill_excel()
-        wb = pyd.autofill_samples(wb)
-        wb = pyd.autofill_equipment(wb)
-        wb.save(filename=fname.with_suffix(".xlsx"))
-
+        # wb = pyd.autofill_excel()
+        # wb = pyd.autofill_samples(wb)
+        # wb = pyd.autofill_equipment(wb)
+        writer = pyd.toWriter()
+        # wb.save(filename=fname.with_suffix(".xlsx"))
+        writer.xl.save(filename=fname.with_suffix(".xlsx"))

 # Below are the custom submission types

@@ -1186,8 +1206,7 @@ class BacterialCulture(BasicSubmission):
        return template

    @classmethod
-    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None,
-                       plate_map: dict | None = None) -> dict:
+    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None) -> dict:
        """
        Extends parent. Currently finds control sample and adds to reagents.

@@ -1201,23 +1220,23 @@ class BacterialCulture(BasicSubmission):
            dict: _description_
        """
        from . import ControlType
-        input_dict = super().finalize_parse(input_dict, xl, info_map, plate_map)
+        input_dict = super().finalize_parse(input_dict, xl, info_map)
        # build regex for all control types that have targets
        regex = ControlType.build_positive_regex()
        # search samples for match
        for sample in input_dict['samples']:
-            matched = regex.match(sample.submitter_id)
+            matched = regex.match(sample['submitter_id'])
            if bool(matched):
-                logger.debug(f"Control match found: {sample.submitter_id}")
+                logger.debug(f"Control match found: {sample['submitter_id']}")
                new_lot = matched.group()
                try:
                    pos_control_reg = \
-                    [reg for reg in input_dict['reagents'] if reg.type == "Bacterial-Positive Control"][0]
+                    [reg for reg in input_dict['reagents'] if reg['type'] == "Bacterial-Positive Control"][0]
                except IndexError:
                    logger.error(f"No positive control reagent listed")
                    return input_dict
-                pos_control_reg.lot = new_lot
-                pos_control_reg.missing = False
+                pos_control_reg['lot'] = new_lot
+                pos_control_reg['missing'] = False
        return input_dict

    @classmethod
@@ -1278,7 +1297,7 @@ class Wastewater(BasicSubmission):
        return output

    @classmethod
-    def parse_info(cls, input_dict: dict, xl: pd.ExcelFile | None = None) -> dict:
+    def parse_info(cls, input_dict: dict, xl: Workbook | None = None) -> dict:
        """
        Update submission dictionary with type specific information. Extends parent

@@ -1290,7 +1309,7 @@ class Wastewater(BasicSubmission):
        """
        input_dict = super().parse_info(input_dict)
        if xl != None:
-            input_dict['csv'] = xl.parse("Copy to import file")
+            input_dict['csv'] = xl["Copy to import file"]
        return input_dict

    @classmethod
@@ -1567,8 +1586,7 @@ class WastewaterArtic(BasicSubmission):
        return "(?P<Wastewater_Artic>(\\d{4}-\\d{2}-\\d{2}(?:-|_)(?:\\d_)?artic)|(RSL(?:-|_)?AR(?:-|_)?20\\d{2}-?\\d{2}-?\\d{2}(?:(_|-)\\d?(\\D|$)R?\\d?)?))"

    @classmethod
-    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None,
-                       plate_map: dict | None = None) -> dict:
+    def finalize_parse(cls, input_dict: dict, xl: pd.ExcelFile | None = None, info_map: dict | None = None) -> dict:
        """
        Performs any final custom parsing of the excel file. Extends parent

@@ -1581,7 +1599,7 @@ class WastewaterArtic(BasicSubmission):
        Returns:
            dict: Updated parser product.
        """
-        input_dict = super().finalize_parse(input_dict, xl, info_map, plate_map)
+        input_dict = super().finalize_parse(input_dict, xl, info_map)
        input_dict['csv'] = xl.parse("hitpicks_csv_to_export")
        return input_dict

@@ -1799,6 +1817,13 @@ class BasicSample(BaseClass):
        except AttributeError:
            return f"<Sample({self.submitter_id})"

+    @classmethod
+    def timestamps(cls) -> List[str]:
+        output = [item.name for item in cls.__table__.columns if isinstance(item.type, TIMESTAMP)]
+        if issubclass(cls, BasicSample) and not cls.__name__ == "BasicSample":
+            output += BasicSample.timestamps()
+        return output
+
    def to_sub_dict(self, full_data: bool = False) -> dict:
        """
        gui friendly dictionary, extends parent method.
@@ -1878,6 +1903,7 @@ class BasicSample(BaseClass):
        Returns:
            dict: Updated parser results.
        """
+        logger.debug(f"Hello from {cls.__name__} sample parser!")
        return input_dict

    @classmethod
@@ -2053,24 +2079,30 @@ class WastewaterSample(BasicSample):
            dict: Updated parser results.
        """
        output_dict = super().parse_sample(input_dict)
-        if output_dict['rsl_number'] == None:
-            output_dict['rsl_number'] = output_dict['submitter_id']
-        if output_dict['ww_full_sample_id'] != None:
+        logger.debug(f"Initial sample dict: {pformat(output_dict)}")
+        try:
+            check = output_dict['rsl_number'] in [None, "None"]
+        except KeyError:
+            check = True
+        if check:
+            output_dict['rsl_number'] = "RSL-WW-" + output_dict['ww_processing_number']
+        if output_dict['ww_full_sample_id'] is not None:
            output_dict["submitter_id"] = output_dict['ww_full_sample_id']
        # Ad hoc repair method for WW (or possibly upstream) not formatting some dates properly.
-        match output_dict['collection_date']:
-            case str():
-                try:
-                    output_dict['collection_date'] = parse(output_dict['collection_date']).date()
-                except ParserError:
-                    logger.error(f"Problem parsing collection_date: {output_dict['collection_date']}")
-                    output_dict['collection_date'] = date(1970, 1, 1)
-            case datetime():
-                output_dict['collection_date'] = output_dict['collection_date'].date()
-            case date():
-                pass
-            case _:
-                del output_dict['collection_date']
+        # NOTE: Should be handled by validator.
+        # match output_dict['collection_date']:
+        #     case str():
+        #         try:
+        #             output_dict['collection_date'] = parse(output_dict['collection_date']).date()
+        #         except ParserError:
+        #             logger.error(f"Problem parsing collection_date: {output_dict['collection_date']}")
+        #             output_dict['collection_date'] = date(1970, 1, 1)
+        #     case datetime():
+        #         output_dict['collection_date'] = output_dict['collection_date'].date()
+        #     case date():
+        #         pass
+        #     case _:
+        #         del output_dict['collection_date']
        return output_dict

    def get_previous_ww_submission(self, current_artic_submission: WastewaterArtic):
@@ -2134,6 +2166,7 @@ class SubmissionSampleAssociation(BaseClass):
    submission_id = Column(INTEGER, ForeignKey("_basicsubmission.id"), primary_key=True)  #: id of associated submission
    row = Column(INTEGER, primary_key=True)  #: row on the 96 well plate
    column = Column(INTEGER, primary_key=True)  #: column on the 96 well plate
+    submission_rank = Column(INTEGER, nullable=False, default=1) #: Location in sample list

    # reference to the Submission object
    submission = relationship(BasicSubmission,
@@ -2193,6 +2226,7 @@ class SubmissionSampleAssociation(BaseClass):
        sample['Plate Name'] = self.submission.rsl_plate_num
        sample['positive'] = False
        sample['submitted_date'] = self.submission.submitted_date
+        sample['submission_rank'] = self.submission_rank
        return sample

    def to_hitpick(self) -> dict | None: