Gene EcDH1_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1961
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2116687
End bp	2117958
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	53%
IMG OID
Product	FeS assembly protein SufD
Protein accession	ACX39618
Protein GI	260449196
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0846147
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGGCT TACCGAACAG CAGTAACGCG CTGCAACAGT GGCATCACTT GTTTGAAGCT 
GAAGGGACAA AACGCTCCCC GCAAGCACAG CAGCATTTAC AACAATTGCT GCGTACCGGA 
CTGCCGACAC GTAAACATGA AAACTGGAAA TATACGCCGC TGGAAGGGCT GATCAATAGC 
CAGTTTGTCA GCATTGCGGG AGAGATATCC CCACAGCAGC GTGATGCCTT AGCGTTAACG 
TTAGACTCCG TGCGGCTGGT GTTTGTCGAT GGGCGTTACG TGCCCGCACT GAGCGATGCA 
ACTGAAGGCA GCGGATATGA AGTGAGCATT AACGACGACC GTCAGGGTTT ACCCGACGCT 
ATTCAGGCGG AAGTGTTTCT GCATTTGACG GAAAGCCTGG CACAAAGCGT GACGCATATC 
GCCGTGAAGC GCGGTCAACG GCCGGCAAAG CCATTGCTGT TAATGCATAT CACCCAGGGC 
GTGGCAGGTG AAGAGGTGAA CACTGCCCAT TACCGACATC ATCTGGATCT GGCGGAAGGT 
GCCGAAGCAA CGGTGATCGA ACATTTTGTC AGCCTGAATG ATGCTCGTCA TTTTACCGGG 
GCACGGTTCA CTATCAACGT CGCAGCGAAT GCCCACTTGC AGCATATCAA GCTGGCGTTT 
GAAAACCCGC TCAGTCACCA CTTTGCTCAT AACGATTTGT TGCTGGCTGA GGATGCCACC 
GCATTTAGCC ACAGTTTCCT GCTGGGTGGC GCAGTGTTAC GACACAACAC CAGTACGCAA 
CTCAATGGCG AAAACAGCAC GCTGCGGATC AATAGCCTGG CGATGCCGGT GAAAAACGAG 
GTGTGTGATA CCCGTACCTG GCTGGAACAC AATAAAGGTT TTTGTAACAG CCGACAGTTG 
CACAAAACTA TCGTCAGCGA CAAAGGCCGC GCGGTATTTA ACGGTTTGAT CAACGTCGCG 
CAGCACGCCA TCAAAACGGA TGGTCAGATG ACCAACAACA ATCTGCTGAT GGGCAAACTG 
GCGGAAGTGG ATACGAAACC GCAGCTGGAA ATCTATGCAG ATGATGTGAA ATGCAGCCAC 
GGCGCGACGG TGGGGCGTAT TGATGATGAA CAGATATTCT ATCTGCGCTC GCGCGGGATC 
AATCAGCAGG ATGCCCAGCA GATGATCATT TACGCCTTCG CTGCCGAACT GACGGAAGCA 
CTGCGTGATG AGGGGCTTAA ACAGCAGGTG CTGGCCCGAA TCGGTCAACG GCTGCCAGGA 
GGTGCAAGAT GA

Protein sequence

MAGLPNSSNA LQQWHHLFEA EGTKRSPQAQ QHLQQLLRTG LPTRKHENWK YTPLEGLINS 
QFVSIAGEIS PQQRDALALT LDSVRLVFVD GRYVPALSDA TEGSGYEVSI NDDRQGLPDA 
IQAEVFLHLT ESLAQSVTHI AVKRGQRPAK PLLLMHITQG VAGEEVNTAH YRHHLDLAEG 
AEATVIEHFV SLNDARHFTG ARFTINVAAN AHLQHIKLAF ENPLSHHFAH NDLLLAEDAT 
AFSHSFLLGG AVLRHNTSTQ LNGENSTLRI NSLAMPVKNE VCDTRTWLEH NKGFCNSRQL 
HKTIVSDKGR AVFNGLINVA QHAIKTDGQM TNNNLLMGKL AEVDTKPQLE IYADDVKCSH 
GATVGRIDDE QIFYLRSRGI NQQDAQQMII YAFAAELTEA LRDEGLKQQV LARIGQRLPG 
GAR