Gene EcSMS35_1515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1515
Symbol	sufD
ID	6143053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1501073
End bp	1502344
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	53%
IMG OID	641616393
Product	cysteine desulfurase activator complex subunit SufD
Protein accession	YP_001743573
Protein GI	170680131
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0719] ABC-type transport system involved in Fe-S cluster assembly, permease component
TIGRFAM ID	[TIGR01981] FeS assembly protein SufD, group 1

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.252227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.00000429728
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGGCT TACCGAACAG CAGTAACGCA CTGCAACAGT GGCATCATTT GTTTGAAGCT 
GAAGTGGCGA AACGCTCCCC GCAAGCACAG CAGCATTTAC AACAATTGCT GCGTACCGGA 
CTGCCGACAC GTAAACATGA AAACTGGAAA TATACGCCGC TGGAAGGGCT GACCAATAGC 
CGGTTTGTCA GCATTGCGGG AGAGATATCC CCACAGCAGC GAGATGCCTT AGCGTTAACG 
TTAGACGCCG TGCGGCTGGT GTTTGTCGAT GGACGTTACG TGTCAGCACT GAGCGATGCG 
ACTGAAGGCA GCGGGTATGA AGTGAGCATT AACGACGACC GTCAGGGGTT ACCCGACGCT 
ATTCAGGCGG AAGTGTTTCT GCATTTGACG GAAAGCCTGG CGCAAAGCGT GACGCATATC 
GCCGTGAAGC GCGGTCAACG ACCGGCAAAG CCATTGCTGT TAATGCATAT CACCCAGGGC 
GTGGCAGGTG AAGAGGTGAA TACTGCCCAT TACCGACATC ATCTGGATCT GGCGGAAGGT 
GCCGAAGCAA CGGTGATCGA ACATTTTGTC AGCCTTAATG ATGCTCGTCA CTTCACCGGC 
GCACGGTTCA CTATCAACGT CGCAGCGAAC GCCCACTTGC AGCATATCAA GCTGGCGTTT 
GAAAACCCGG TCAGTCACCA CTTTGCCCAT AACGATTTGT TGCTGGCTGA CGATGCCACC 
GCATTTAGCC ACAGTTTCCT GCTGGGTGGC GCAGTGTTAC GACACAACAC CAGTACGCAA 
CTCAATGGCG AAAACAGCAC GCTGCGGATC AATAGCCTGG CGATGCCGGT GAAAAACGAG 
GTGTGTGATA CCCGTACCTG GCTGGAACAC AATAAAGGTT TTTGTAACAG TCGACAGTTG 
CATAAAACTA TCGTCAGCGA CAAAGGCCGC GCGGTATTTA ACGGTTTGAT CAACGTCGCG 
CAGCACGCCA TCAAAACGGA TGGTCAGATG ACCAACAATA ATCTGCTGAT GGGCAAACTG 
GCGGAAGTGG ATACGAAACC GCAGCTGGAA ATCTATGCAG ATGATGTGAA ATGCAGCCAC 
GGCGCGACGG TGGGGCGTAT TGATGATGAA CAGATGTTCT ATCTGCGCTC GCGCGGGATC 
AATCAGCAGG ATGCCCAGCA GATGATCATT TACGCCTTTG CTGCTGAACT GACGGAAGCA 
CTGCGTGATG AGGGTCTTAA ACAGCAGGTG CTGGCCCGAA TCGGTCAACG GCTGCCAGGA 
GGTGCAAGAT GA

Protein sequence

MAGLPNSSNA LQQWHHLFEA EVAKRSPQAQ QHLQQLLRTG LPTRKHENWK YTPLEGLTNS 
RFVSIAGEIS PQQRDALALT LDAVRLVFVD GRYVSALSDA TEGSGYEVSI NDDRQGLPDA 
IQAEVFLHLT ESLAQSVTHI AVKRGQRPAK PLLLMHITQG VAGEEVNTAH YRHHLDLAEG 
AEATVIEHFV SLNDARHFTG ARFTINVAAN AHLQHIKLAF ENPVSHHFAH NDLLLADDAT 
AFSHSFLLGG AVLRHNTSTQ LNGENSTLRI NSLAMPVKNE VCDTRTWLEH NKGFCNSRQL 
HKTIVSDKGR AVFNGLINVA QHAIKTDGQM TNNNLLMGKL AEVDTKPQLE IYADDVKCSH 
GATVGRIDDE QMFYLRSRGI NQQDAQQMII YAFAAELTEA LRDEGLKQQV LARIGQRLPG 
GAR