get_db_info: get_db_info.py comparison

planemo upload for repository https://github.com/brsynth commit 6ae809b563b40bcdb6be2e74fe2a84ddad5484ae

comparison

equal deleted inserted replaced

-:ee28ec28140d
+:5b16f2911491
 all_rows = connection.execute(text(f"SELECT * FROM {table_name}")).fetchall()
 fragment_map = {row[fragment_column_index]: row for row in all_rows}
 # Compare fragments between CSV and DB
 csv_fragments = set()
-all_ids = set(df[0])
+all_ids = set(df[0].dropna().astype(str))
 for _, row in df.iterrows():
 for col in df.columns:
-if col != 0:  # Skip the first column
+if col != 0:
 fragment = row[col]
-if fragment not in all_ids:
+if pd.notna(fragment):
-csv_fragments.add(fragment)
+fragment_str = str(fragment)
+if fragment_str not in all_ids:
+csv_fragments.add(fragment_str)
 db_fragments = set(fragment_map.keys())
 missing_fragments = sorted(list(csv_fragments - db_fragments))
 if missing_fragments:
 raise ValueError(
 f" Missing fragments in DB: {', '.join(missing_fragments)}"
 )
 for _, row in df.iterrows():
 annotated_row = {"Backbone": row[0], "Fragments": []}
 for col in df.columns:
 if col != 0:
 fragment = row[col]
+if fragment not in csv_fragments:
+continue
 db_row = fragment_map.get(fragment)
 if db_row:
 fragment_data = {"id": fragment}
 for i, column_name in enumerate(columns[1:]):  # skip ID column

Mercurial > repos > tduigou > get_db_info