Gene EcDH1_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1239
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	1336158
End bp	1337255
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID
Product	sulfate ABC transporter, ATPase subunit
Protein accession	ACX38913
Protein GI	260448491
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.525663
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATTG AGATTGCCAA TATTAAGAAG TCGTTTGGTC GCACCCAGGT GCTGAACGAT 
ATCTCACTGG ATATTCCTTC AGGTCAGATG GTCGCGTTGC TGGGGCCGTC CGGTTCCGGG 
AAAACCACGC TGCTGCGCAT TATCGCCGGG CTGGAGCATC AAACCAGCGG GCATATTCGC 
TTCCACGGCA CCGACGTGAG CCGCCTGCAC GCACGTGATC GTAAAGTCGG TTTCGTGTTC 
CAGCATTACG CGCTGTTCCG CCATATGACG GTGTTCGACA ATATCGCTTT TGGCCTGACG 
GTGCTGCCGC GTCGCGAGCG CCCGAATGCC GCAGCCATCA AAGCGAAAGT GACAAAATTG 
CTGGAAATGG TCCAGCTTGC CCATCTGGCG GATCGTTATC CGGCGCAGCT TTCCGGCGGC 
CAGAAACAGC GCGTGGCGCT GGCGCGCGCG CTGGCTGTGG AACCGCAAAT TCTGCTGCTT 
GATGAACCGT TTGGCGCGCT GGATGCGCAG GTGCGTAAAG AGCTGCGTCG CTGGCTGCGT 
CAACTCCATG AAGAACTAAA ATTCACCAGC GTTTTTGTGA CCCACGATCA GGAAGAAGCG 
ACCGAAGTAG CTGATCGTGT AGTTGTGATG AGCCAGGGCA ATATTGAACA GGCTGACGCG 
CCGGATCAGG TATGGCGCGA ACCGGCGACC CGTTTTGTGC TCGAATTTAT GGGCGAAGTG 
AACCGCCTGC AGGGAACCAT TCGCGGCGGG CAGTTCCATG TTGGCGCGCA TCGCTGGCCG 
CTGGGCTACA CACCTGCGTA TCAGGGGCCG GTGGATCTCT TCCTGCGCCC TTGGGAAGTG 
GATATCAGCC GCCGTACCAG CCTCGATTCG CCGCTGCCGG TACAGGTACT GGAAGCCAGC 
CCGAAAGGTC ACTACACCCA ATTAGTGGTG CAGCCGCTGG GGTGGTACAA CGAACCGCTG 
ACGGTCGTGA TGCATGGCGA CGATGCCCCG CAGCGTGGCG AGCGTTTATT CGTTGGTCTG 
CAACATGCGC GGCTGTATAA CGGCGACGAG CGTATCGAAA CCCGCGATGA GGAACTTGCT 
CTCGCACAAA GCGCCTGA

Protein sequence

MSIEIANIKK SFGRTQVLND ISLDIPSGQM VALLGPSGSG KTTLLRIIAG LEHQTSGHIR 
FHGTDVSRLH ARDRKVGFVF QHYALFRHMT VFDNIAFGLT VLPRRERPNA AAIKAKVTKL 
LEMVQLAHLA DRYPAQLSGG QKQRVALARA LAVEPQILLL DEPFGALDAQ VRKELRRWLR 
QLHEELKFTS VFVTHDQEEA TEVADRVVVM SQGNIEQADA PDQVWREPAT RFVLEFMGEV 
NRLQGTIRGG QFHVGAHRWP LGYTPAYQGP VDLFLRPWEV DISRRTSLDS PLPVQVLEAS 
PKGHYTQLVV QPLGWYNEPL TVVMHGDDAP QRGERLFVGL QHARLYNGDE RIETRDEELA 
LAQSA