Gene EcHS_A3770 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3770
Symbol	xylG
ID	5593640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3761504
End bp	3763045
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	47%
IMG OID	640922884
Product	xylose transporter ATP-binding subunit
Protein accession	YP_001460362
Protein GI	157163044
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID	[TIGR02633] D-xylose ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTATC TACTTGAAAT GAAGAACATT ACCAAAACCT TCGGCAGTGT GAAGGCGATT 
GATAACGTCT GCTTGCGGTT GAATGCTGGC GAAATCGTCT CACTTTGTGG GGAAAATGGG 
TCTGGTAAAT CAACGCTGAT GAAAGTGCTG TGTGGTATTT ATCCCCATGG CTCCTACGAA 
GGCGAAATTA TTTTTGCGGG AGAAGAGATT CAGGCGAGTC ACATCCGCGA TACCGAACGC 
AAAGGTATCG CCATCATTCA TCAGGAATTG GCCCTGGTGA AAGAATTGAC CGTGCTGGAA 
AATATCTTCC TGGGTAACGA AATAACCCAC AATGGCATTA TGGATTATGA CCTGATGACG 
CTACGCTGTC AGAAGCTGCT CGCACAGGTC AGTTTATCCA TTTCACCTGA TACCCGCGTT 
GGCGATTTAG GGCTTGGGCA ACAACAACTG GTTGAAATTG CCAAGGCACT TAATAAACAG 
GTGCGCTTGT TAATTCTCGA TGAACCGACA GCCTCATTAA CTGAGCAGGA AACGTCGGTT 
TTACTGGATA TTATTCGCGA TCTACAACAG CACGGTATCG CCTGTATTTA TATTTCGCAC 
AAACTCAACG AAGTCAAAGC GATTTCCGAT ACGATTTGCG TTATTCGCGA CGGACAGCAC 
ATTGGTACGC GTGATGCTGC CGGAATGAGT GAAGACGATA TTATCACCAT GATGGTCGGG 
CGAGAGTTAA CCGCGCTTTA CCCTAATGAA CCACATACCA CCGGAGATGA AATATTACGT 
ATTGAACATC TGACGGCATG GCATCCGATC AATCGTCATA TTAAACGAGT TAATGATGTC 
TCGTTTTCCC TGAAACGTGG CGAAATACTG GGTATTGCCG GACTCGTTGG TGCCGGACGT 
ACCGAGACCA TTCAGTGCCT GTTTGGCGTG TGGCCCGGAC AATGGGAAGG AAAAATTTAT 
ATTGATGGCA AACAGGTAGA TATTCGTAAC TGTCAGCAAG CCATCGCCCA GGGGATTGCG 
ATGGTACCCG AAGACAGAAA GCGCGACGGC ATCGTTCCGG TAATGGCGGT TGGTAAAAAT 
ATTACCCTCG CCGCACTCAA TAAATTTACC GGTGGCATTA GCCAGCTTGA TGACGCGGCA 
GAGCAAAAAT GTATTCTGGA ATCAATCCAG CAACTCAAAG TTAAAACGTC GTCCCCCGAC 
CTTGCTATTG GACGTTTGAG CGGCGGCAAT CAGCAAAAAG CGATCCTCGC TCGCTGTCTG 
TTACTTAACC CGCGCATTCT CATTCTTGAT GAACCCACCA GGGGTATCGA TATTGGCGCG 
AAATACGAGA TCTACAAATT AATTAACCAA CTCGTCCAGC AGGGTATTGC CGTTATTGTC 
ATCTCTTCCG AATTACCTGA AGTGCTCGGC CTTAGCGATC GTGTACTGGT GATGCATGAA 
GGGAAACTAA AAGCCAACCT GATAAATCAT AACCTGACTC AGGAGCAGGT GATGGAAGCC 
GCATTGAGGA GCGAACATCA TGTCGAAAAG CAATCCGTCT GA

Protein sequence

MPYLLEMKNI TKTFGSVKAI DNVCLRLNAG EIVSLCGENG SGKSTLMKVL CGIYPHGSYE 
GEIIFAGEEI QASHIRDTER KGIAIIHQEL ALVKELTVLE NIFLGNEITH NGIMDYDLMT 
LRCQKLLAQV SLSISPDTRV GDLGLGQQQL VEIAKALNKQ VRLLILDEPT ASLTEQETSV 
LLDIIRDLQQ HGIACIYISH KLNEVKAISD TICVIRDGQH IGTRDAAGMS EDDIITMMVG 
RELTALYPNE PHTTGDEILR IEHLTAWHPI NRHIKRVNDV SFSLKRGEIL GIAGLVGAGR 
TETIQCLFGV WPGQWEGKIY IDGKQVDIRN CQQAIAQGIA MVPEDRKRDG IVPVMAVGKN 
ITLAALNKFT GGISQLDDAA EQKCILESIQ QLKVKTSSPD LAIGRLSGGN QQKAILARCL 
LLNPRILILD EPTRGIDIGA KYEIYKLINQ LVQQGIAVIV ISSELPEVLG LSDRVLVMHE 
GKLKANLINH NLTQEQVMEA ALRSEHHVEK QSV