Gene Saro_2780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2780
Symbol
ID	3916940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2999521
End bp	3001764
Gene Length	2244 bp
Protein Length	747 aa
Translation table	11
GC content	65%
IMG OID	640445559
Product	excinuclease ABC subunit B
Protein accession	YP_498050
Protein GI	87200793
COG category	[L] Replication, recombination and repair
COG ID	[COG0556] Helicase subunit of the DNA excision repair complex
TIGRFAM ID	[TIGR00631] excinuclease ABC, B subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.768947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTGGA TCACTTCGGT TGCGCGGACG CTGTTTGTTC CCCATATCCG GCGCATGGCC 
GAACTCGTTA TCCGCAGGGG ACTCGAAGAG CCCGACACCT CCGGCACCTT CGTGCCCCAC 
CGCCCCGCAA GGCCGGACAA GGTGGAAGGC GGCAAGCGCT TCAGGATCGT GTCCGACTAC 
CAGCCGGCGG GCGACCAGCC GACCGCCATC GCCGATCTCG TCGAAGGCAT CCGCGCGGAT 
GACAAGACGC AGGTCCTGCT TGGCGTCACC GGTTCGGGCA AGACCTTCAC GATGGCGCAG 
GTCATCGAGG CGACCCAGCG GCCCGCGCTG ATCCTTGCCC CCAACAAGAT CCTCGCCGCC 
CAGCTCTATG GCGAGATGAA GAGCTTCTTC CCCGAAAACG CGGTCGAATA TTTCGTCTCC 
TACTACGACT ACTACCAGCC GGAGGCCTAC GTGCCCCGGT CGGACACCTA CATCGAGAAG 
GAAAGCTCGG TGAACGAGGC GATCGACCGG ATGCGCCACT CGGCCACCCG CGCCCTGCTG 
GAGCGCGACG ACGTGATCAT CGTCGCCTCG GTCTCGTGCC TCTATGGCAT CGGCTCGGTC 
GAAACCTACT CGGCCATGAT CTTCGACCTC AAGGTCGGCA CCACGGTCGA CAGCGGCGAG 
ATCATCCGCA AGCTGGTGGC CCTGCAGTAC AAGCGCAACG ATGCCGCCTT CAGTCGCGGC 
AACTTCCGCG TACGCGGCGA CAATCTCGAG ATCTTCCCCT CGCACTACGA AGACGTTGCC 
TGGCGCATCT CGTTCTTCGG CGACGAGATC GAGCAGATCG TCGAGTTCGA TCCGCTGACC 
GGCAAGGCGG GCACGAAGCT CACCGCGATC CGCGTCTACG CCAATTCGCA CTACGTGACG 
CCCGGCCCGA CGATGAAGCA GGCCGCAGAC GCGATCCGCT TCGAACTGAC CGAGCGGCTC 
AAGGAACTGG TCGCGGAAGG AAAGCTGCTC GAAGCGCAAC GGCTGGAACA GCGCACCAAC 
TTCGACCTGG AAATGATCGC CGCGACCGGT TCATGCGCCG GGATCGAGAA CTACAGCCGT 
TTCCTGACCG GCCGCCTCCC CGGCGAACCG CCCCCCACGC TGTTCGAATA CCTGCCGGAC 
AATGCCCTGC TCTTCGTCGA CGAGAGCCAC CAGACGGTGC CGCAGATCGG CGCGATGGCG 
CGAGGCGACC ATCGCCGCAA GCTTACGCTC GCCGAATACG GCTTCCGCCT GCCGAGCTGC 
ATCGACAACC GACCGCTGCG CTTCAACGAA TGGGACGCGA TGCGCCCCCA GACGGTCGCG 
GTCTCGGCCA CCCCGGGCGG CTGGGAAATG GAGCAGGCCG GCGGCGTCTT TGCCGAACAG 
GTCATCCGCC CGACCGGCCT GATCGACCCG CCGGTGCTGA TCCGCCCGGT CGAGGACCAG 
GTGCAGGACT GCATCAACGA GTGCCGCGAG ACCGCCGCCA AGGGCTATCG CACGCTCGTC 
ACCACCCTGA CCAAGCGCAT GGCGGAAGAC CTGACCGAGT TCATGCACGA AGCGGGCCTG 
CGCGTACGCT ACATGCACTC CGACGTCGAG ACGCTGGAGC GCATCGAGCT GATCCGCGAC 
CTGCGGCTTG GCGTCTATGA CGTTCTCGTC GGCATCAACC TGCTGCGCGA AGGTCTCGAC 
ATTCCCGAGT GCGGCCTCGT CTGCATCCTC GATGCCGACA AGGAGGGCTT CCTGCGCTCC 
GAGACCTCGC TGATCCAGAC CATCGGCCGC GCCGCGCGCA ACGTCGATGG CCGCGTCATC 
CTCTATGCCG ATCGCATGAC CGGCTCGATG GAACGCGCCA TCGCCGAAAC CGACCGCCGC 
CGCGCAAAGC AGCAGGCCTA CAACGAAGAA CACGGCATCA CGCCGCAAAC GATCAAGCGC 
AACATCCACG ACATCGTCGC GGATACCGCC AGCCGCGACG GCGTGGTCGT CGACACCGGC 
GACGACGAGC GCAACAACCT CGTCGGCCAC AACCTGCGCG CCTATATCGA GGACCTCGAA 
AAGCGCATGC GCGCGGCCGC AGCGGACCTC GAATTCGAGG AAGCCGGCCG CCTGCGCGAC 
GAGATCAGGC GGCTCGAGGC CACCGAACTC GGCCTGCCTG AAGGCGAGCG GAAAGCGCCG 
ATCGTGGGAC GCAGCAACGA AGGCAAGCCG GGTACGCGCA AGACGCGCTA CGGGAAGTCA 
CAGAAGACGA AGTGGGGGAA GTAG

Protein sequence

MAWITSVART LFVPHIRRMA ELVIRRGLEE PDTSGTFVPH RPARPDKVEG GKRFRIVSDY 
QPAGDQPTAI ADLVEGIRAD DKTQVLLGVT GSGKTFTMAQ VIEATQRPAL ILAPNKILAA 
QLYGEMKSFF PENAVEYFVS YYDYYQPEAY VPRSDTYIEK ESSVNEAIDR MRHSATRALL 
ERDDVIIVAS VSCLYGIGSV ETYSAMIFDL KVGTTVDSGE IIRKLVALQY KRNDAAFSRG 
NFRVRGDNLE IFPSHYEDVA WRISFFGDEI EQIVEFDPLT GKAGTKLTAI RVYANSHYVT 
PGPTMKQAAD AIRFELTERL KELVAEGKLL EAQRLEQRTN FDLEMIAATG SCAGIENYSR 
FLTGRLPGEP PPTLFEYLPD NALLFVDESH QTVPQIGAMA RGDHRRKLTL AEYGFRLPSC 
IDNRPLRFNE WDAMRPQTVA VSATPGGWEM EQAGGVFAEQ VIRPTGLIDP PVLIRPVEDQ 
VQDCINECRE TAAKGYRTLV TTLTKRMAED LTEFMHEAGL RVRYMHSDVE TLERIELIRD 
LRLGVYDVLV GINLLREGLD IPECGLVCIL DADKEGFLRS ETSLIQTIGR AARNVDGRVI 
LYADRMTGSM ERAIAETDRR RAKQQAYNEE HGITPQTIKR NIHDIVADTA SRDGVVVDTG 
DDERNNLVGH NLRAYIEDLE KRMRAAAADL EFEEAGRLRD EIRRLEATEL GLPEGERKAP 
IVGRSNEGKP GTRKTRYGKS QKTKWGK