Gene EcDH1_0143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0143
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	150021
End bp	151562
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	47%
IMG OID
Product	D-xylose ABC transporter, ATPase subunit
Protein accession	ACX37837
Protein GI	260447415
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTATC TACTTGAAAT GAAGAACATT ACCAAAACCT TCGGCAGTGT GAAGGCGATT 
GATAACGTCT GCTTGCGGTT GAATGCTGGC GAAATCGTCT CACTTTGTGG GGAAAATGGG 
TCTGGTAAAT CAACGCTGAT GAAAGTGCTG TGTGGTATTT ATCCCCATGG CTCCTACGAA 
GGCGAAATTA TTTTTGCGGG AGAAGAGATT CAGGCGAGTC ACATCCGCGA TACCGAACGC 
AAAGGTATCG CCATCATTCA TCAGGAATTG GCCCTGGTGA AAGAATTGAC CGTGCTGGAA 
AATATCTTCC TGGGTAACGA AATAACCCAC AATGGCATTA TGGATTATGA CCTGATGACG 
CTACGCTGTC AGAAGCTGCT CGCACAGGTC AGTTTATCCA TTTCACCTGA TACCCGCGTT 
GGCGATTTAG GGCTTGGGCA ACAACAACTG GTTGAAATTG CCAAGGCACT TAATAAACAG 
GTGCGCTTGT TAATTCTCGA TGAACCGACA GCCTCATTAA CTGAGCAGGA AACGTCGATT 
TTACTGGATA TTATTCGCGA TCTACAACAG CACGGTATCG CCTGTATTTA TATTTCGCAC 
AAACTCAACG AAGTCAAAGC GATTTCCGAT ACGATTTGCG TTATTCGCGA CGGACAGCAC 
ATTGGTACGC GTGATGCTGC CGGAATGAGT GAAGACGATA TTATCACCAT GATGGTCGGG 
CGAGAGTTAA CCGCGCTTTA CCCTAATGAA CCACATACCA CCGGAGATGA AATATTACGT 
ATTGAACATC TGACGGCATG GCATCCGGTT AATCGTCATA TTAAACGAGT TAATGATGTC 
TCGTTTTCCC TGAAACGTGG CGAAATATTG GGTATTGCCG GACTCGTTGG TGCCGGACGT 
ACCGAGACCA TTCAGTGCCT GTTTGGTGTG TGGCCCGGAC AATGGGAAGG AAAAATTTAT 
ATTGATGGCA AACAGGTAGA TATTCGTAAC TGTCAGCAAG CCATCGCCCA GGGGATTGCG 
ATGGTCCCCG AAGACAGAAA GCGCGACGGC ATCGTTCCGG TAATGGCGGT TGGTAAAAAT 
ATTACCCTCG CCGCACTCAA TAAATTTACC GGTGGCATTA GCCAGCTTGA TGACGCGGCA 
GAGCAAAAAT GTATTCTGGA ATCAATCCAG CAACTCAAAG TTAAAACGTC GTCCCCCGAC 
CTTGCTATTG GACGTTTGAG CGGCGGCAAT CAGCAAAAAG CGATCCTCGC TCGCTGTCTG 
TTACTTAACC CGCGCATTCT CATTCTTGAT GAACCCACCA GGGGTATCGA TATTGGCGCG 
AAATACGAGA TCTACAAATT AATTAACCAA CTCGTCCAGC AGGGTATTGC CGTTATTGTC 
ATCTCTTCCG AATTACCTGA AGTGCTCGGC CTTAGCGATC GTGTACTGGT GATGCATGAA 
GGGAAACTAA AAGCCAACCT GATAAATCAT AACCTGACTC AGGAGCAGGT GATGGAAGCC 
GCATTGAGGA GCGAACATCA TGTCGAAAAG CAATCCGTCT GA

Protein sequence

MPYLLEMKNI TKTFGSVKAI DNVCLRLNAG EIVSLCGENG SGKSTLMKVL CGIYPHGSYE 
GEIIFAGEEI QASHIRDTER KGIAIIHQEL ALVKELTVLE NIFLGNEITH NGIMDYDLMT 
LRCQKLLAQV SLSISPDTRV GDLGLGQQQL VEIAKALNKQ VRLLILDEPT ASLTEQETSI 
LLDIIRDLQQ HGIACIYISH KLNEVKAISD TICVIRDGQH IGTRDAAGMS EDDIITMMVG 
RELTALYPNE PHTTGDEILR IEHLTAWHPV NRHIKRVNDV SFSLKRGEIL GIAGLVGAGR 
TETIQCLFGV WPGQWEGKIY IDGKQVDIRN CQQAIAQGIA MVPEDRKRDG IVPVMAVGKN 
ITLAALNKFT GGISQLDDAA EQKCILESIQ QLKVKTSSPD LAIGRLSGGN QQKAILARCL 
LLNPRILILD EPTRGIDIGA KYEIYKLINQ LVQQGIAVIV ISSELPEVLG LSDRVLVMHE 
GKLKANLINH NLTQEQVMEA ALRSEHHVEK QSV