Gene SbBS512_E3955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3955
Symbol	xylG
ID	6273219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3689926
End bp	3691467
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	47%
IMG OID	641727804
Product	xylose transporter ATP-binding subunit
Protein accession	YP_001882237
Protein GI	187730122
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID	[TIGR02633] D-xylose ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTATC TACTTGAAAT GAAGAACATT ACCAAAACCT TCGGCAGTGT GAAGGCGATT 
GATAACGTCA GCTTGCGGTT GAATGCTGGC GAAATCGTCT CACTCTGTGG GGAAAATGGG 
TCTGGTAAAT CAACGCTGAT GAAAGTGCTG TGTGGTATTT ATCCCCATGG CTCCTACGAA 
GGCGAAATTA TTTTTGCGGG AGAAGAGATT CAGGCGAGTC ACATCCGCGA TACCGAACGC 
AAAGGTATCG CCATCATTCA CCAGGAATTG GCCCTGGTGA AAGAATTGAC CGTGCTGGAA 
AATATCTTCC TGGGTAACGA AATAACCCAC AATGGCATTA TGGATTATGA CCTGATGACG 
CTACGCTGTC AGAAGCTGCT CGCACAGGTC AGTTTATCCA TTTCACCTGA TACCCGCGTT 
GGCGATTTAG GGCTTGGGCA ACAACAACTG GTTGAAATTG CCAAGGCACT TAATAAACAG 
GTGCGCTTGT TAATTCTCGA TGAACCGACA GCCTCATTAA CTGAGCAGGA AACGTCGGTT 
TTACTGGATA TTATTCGCGA TCTACAACAG CACGGTATCG CCTGTATTTA TATTTCGCAC 
AAACTCAACG AAGTCAAAGC GATTTCCGAT ACGATTTGCG TTATTCGCGA CGGTCAGCAC 
ATTGGTACGC GTGATGCTGC CGGAATGAGT GAAGACGATA TTATCACCAT GATGGTCGGG 
CGAGAGTTAA CCGCGCTTTA CCCTAATGAA CCACATACCA CCGGAGATGA AATATTACGT 
ATTGAACATC TGACGGCATG GCATCCGGTT AATCGTCATA TTAAACGAGT TAATGATGTC 
TCGTTTTCCC TGAAACGTGG CGAAATACTG GGTATTGCCG GACTCGTTGG TGCCGGACGT 
ACCGAGACCA TTCAGTGCCT GTTTGGCGTG TGGCCCGGAC AATGGGAAGG AAAAATTTAT 
ATTGATGGCA AACAGGTAGA TATTCGTAAC TGTCAGCAAG CCATCGCCCA GGGGATTGCG 
ATGGTACCCG AAGACAGAAA GCGCGACGGC ATCGTTCCGG TAATGGCGGT TGGTAAAAAT 
ATTACCCTCG CCGCACTCAA TAAATTTACC GGTGGCATTA GCCAGCTTGA TGACGCGGCA 
GAGCAAAAAT GTATTCTGGA ATCAATCCAG CAACTCAAAG TTAAAACGTC GTCCCCCGAT 
CTTGCTATTG GACGTTTGAG CGGCGGCAAT CAGCAAAAAG CGATCCTCGC CCGCTGTCTG 
TTACTCAACC CGCGCATTCT CATTCTTGAT GAACCTACCA GGGGTATTGA TATTGGCGTG 
AAATATGAGA TCTACAAATT AATTAACCAA CTCGTCCAGC AGGGTATTGC CGTTATTGTC 
ATCTCTTCCG AATTACCTGA AGTGCTCGGC CTTAGCGATC GTGTACTGGT GATGCATGAA 
GGGAAACTAA AAGCCAACCT GATAAATCAT AACCTGACTC AGGAGCAGGT GATGGAAGCC 
GCATTGAGGA GCGAACATCA TGTCGAAAAG CAATCCGTCT GA

Protein sequence

MPYLLEMKNI TKTFGSVKAI DNVSLRLNAG EIVSLCGENG SGKSTLMKVL CGIYPHGSYE 
GEIIFAGEEI QASHIRDTER KGIAIIHQEL ALVKELTVLE NIFLGNEITH NGIMDYDLMT 
LRCQKLLAQV SLSISPDTRV GDLGLGQQQL VEIAKALNKQ VRLLILDEPT ASLTEQETSV 
LLDIIRDLQQ HGIACIYISH KLNEVKAISD TICVIRDGQH IGTRDAAGMS EDDIITMMVG 
RELTALYPNE PHTTGDEILR IEHLTAWHPV NRHIKRVNDV SFSLKRGEIL GIAGLVGAGR 
TETIQCLFGV WPGQWEGKIY IDGKQVDIRN CQQAIAQGIA MVPEDRKRDG IVPVMAVGKN 
ITLAALNKFT GGISQLDDAA EQKCILESIQ QLKVKTSSPD LAIGRLSGGN QQKAILARCL 
LLNPRILILD EPTRGIDIGV KYEIYKLINQ LVQQGIAVIV ISSELPEVLG LSDRVLVMHE 
GKLKANLINH NLTQEQVMEA ALRSEHHVEK QSV