Gene EcolC_0147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0147
Symbol
ID	6068295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	161084
End bp	162625
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	47%
IMG OID	641599547
Product	xylose transporter ATP-binding subunit
Protein accession	YP_001723156
Protein GI	170018202
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID	[TIGR02633] D-xylose ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTATC TACTTGAAAT GAAGAACATT ACCAAAACCT TCGGCAGTGT GAAGGCGATT 
GATAACGTCT GCTTGCGGTT GAATGCTGGC GAAATCGTCT CACTTTGTGG GGAAAATGGG 
TCTGGTAAAT CAACGCTGAT GAAAGTGCTG TGTGGTATTT ATCCCCATGG CTCCTACGAA 
GGCGAAATTA TTTTTGCGGG AGAAGAGATT CAGGCGAGTC ACATCCGCGA TACCGAACGC 
AAAGGTATCG CCATCATTCA TCAGGAATTG GCCCTGGTGA AAGAATTGAC CGTGCTGGAA 
AATATCTTCC TGGGTAACGA AATAACCCAC AATGGCATTA TGGATTATGA CCTGATGACG 
CTACGCTGTC AGAAGCTGCT CGCACAGGTC AGTTTATCCA TTTCACCTGA TACCCGCGTT 
GGCGATTTAG GGCTTGGGCA ACAACAACTG GTTGAAATTG CCAAGGCACT TAATAAACAG 
GTGCGCTTGT TAATTCTCGA TGAACCGACA GCCTCATTAA CTGAGCAGGA AACGTCGGTT 
TTACTGGATA TTATTCGCGA TCTACAACAG CACGGTATCG CCTGTATTTA TATTTCGCAC 
AAACTCAACG AAGTCAAAGC GATTTCCGAT ACGATTTGCG TTATTCGCGA CGGACAGCAC 
ATTGGTACGC GTGATGCTGC CGGAATGAGT GAAGACGATA TTATCACCAT GATGGTCGGG 
CGAGAGTTAA CCGCGCTTTA CCCTAATGAA CCACATACCA CCGGAGATGA AATATTACGT 
ATTGAACATC TGACGGCATG GCATCCGGTC AATCGTCATA TTAAACGAGT TAATGATGTC 
TCGTTTTCCC TGAAACGTGG CGAAATACTG GGTATTGCCG GACTCGTTGG TGCCGGACGT 
ACCGAGACCA TTCAGTGCCT GTTTGGCGTG TGGCCCGGAC AATGGGAAGG AAAAATTTAT 
ATTGATGGCA AACAGGTAGA TATTCGTAAC TGTCAGCAAG CCATCGCCCA GGGGATTGCG 
ATGGTACCCG AAGACAGAAA GCGCGACGGC ATCGTTCCGG TAATGGCGGT TGGTAAAAAT 
ATTACCCTCG CCGCACTCAA TAAATTTACC GGTGGCATTA GCCAGCTTGA TGACGCGGCA 
GAGCAAAAAT GTATTCTGGA ATCAATCCAG CAACTCAAAG TTAAAACGTC GTCCCCCGAC 
CTTGCTATTG GACGTTTGAG CGGCGGCAAT CAGCAAAAAG CGATCCTCGC TCGCTGTCTG 
TTACTTAACC CGCGCATTCT CATTCTTGAT GAACCCACCA GGGGTATCGA TATTGGCGCG 
AAATACGAGA TCTACAAATT AATTAACCAA CTCGTCCAGC AGGGTATTGC CGTTATTGTC 
ATCTCTTCCG AATTACCTGA AGTGCTCGGC CTTAGCGATC GTGTACTGGT GATGCATGAA 
GGGAAACTAA AAGCCAACCT GATAAATCAT AACCTGACTC AGGAGCAGGT GATGGAAGCC 
GCATTGAGGA GCGAACATCA TGTCGAAAAG CAATCCGTCT GA

Protein sequence

MPYLLEMKNI TKTFGSVKAI DNVCLRLNAG EIVSLCGENG SGKSTLMKVL CGIYPHGSYE 
GEIIFAGEEI QASHIRDTER KGIAIIHQEL ALVKELTVLE NIFLGNEITH NGIMDYDLMT 
LRCQKLLAQV SLSISPDTRV GDLGLGQQQL VEIAKALNKQ VRLLILDEPT ASLTEQETSV 
LLDIIRDLQQ HGIACIYISH KLNEVKAISD TICVIRDGQH IGTRDAAGMS EDDIITMMVG 
RELTALYPNE PHTTGDEILR IEHLTAWHPV NRHIKRVNDV SFSLKRGEIL GIAGLVGAGR 
TETIQCLFGV WPGQWEGKIY IDGKQVDIRN CQQAIAQGIA MVPEDRKRDG IVPVMAVGKN 
ITLAALNKFT GGISQLDDAA EQKCILESIQ QLKVKTSSPD LAIGRLSGGN QQKAILARCL 
LLNPRILILD EPTRGIDIGA KYEIYKLINQ LVQQGIAVIV ISSELPEVLG LSDRVLVMHE 
GKLKANLINH NLTQEQVMEA ALRSEHHVEK QSV