Gene SbBS512_E3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3102
Symbol
ID	6272847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2899139
End bp	2900476
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	53%
IMG OID	641727029
Product	major facilitator family transporter
Protein accession	YP_001881488
Protein GI	187732211
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00000189575
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACTT CACCGGTGCG AATGGATGAT TTACCGCTTA ACCGTTTTCA CTGCCGCATT 
GCTGCGCTCA CTTTCGGCGC ACACCTGACC GACGGTTATG TTCTCGGCGT CATTGGTTAC 
GCCATTATTC AGCTTACGCC CGCCATGCAA CTGACGCCGT TTATGGCGGG AATGATCGGC 
GGCTCGGCGC TCCTTGGTTT GTTCCTTGGC AGCCTGGTTC TTGGGTGGAT CTCCGACCAT 
ATTGGTCGGC AAAAAATCTT CACCTTCAGC TTTTTGCTGA TTACGCTTGC TTCGTTTTTA 
CAATTTTTTG CCACCACGCC AGAGCATCTT ATTGGACTGC GCATTTTGAT TGGCATTGGT 
CTGGGAGGCG ATTATTCAGT AGGTCACACC TTGCTGGCTG AATTTTCCCC GCGCCGCCAT 
CGCGGTATTT TGCTGGGCGC ATTCAGCGTG GTGTGGACCG TAGGCTATGT GCTGGCAAGT 
ATTGCCGGAC ATCACTTTAT TTCCGAAAAC CCGGAGGCCT GGCGCTGGCT ACTGGCATCG 
GCAGCTCTGC CCGCGTTGTT GATTACGTTA TTACGCTGGG GAACGCCAGA ATCACCACGC 
TGGCTACTGC GCCAGGGGCG TTTTGCAGAA GCTCACGCTA TCGTGCATCG CTATTTTGGT 
CCCCATGTTT TACTGGGCGA TGAAGTGGTA ACGGCGACCC ATAAACACAT CAAAACCTTG 
TTCTCTTCGC GTTACTGGCG GCGCACGGCG TTTAACAGCG TCTTCTTTGT CTGCCTCGTA 
ATCCCATGGT TTGTGATTTA TACCTGGCTG CCAACTATCG CCCAGACTAT TGGTCTGGAA 
GATGCGCTGA CTGCCAGCCT GATGCTTAAT GCGTTGTTAA TTGTGGGCGC GCTGCTGGGA 
TTAGTTCTGA CGCACCTGCT GGCACATCGC AAATTTTTGC TGGGAAGTTT TTTGCTGCTG 
GCGGCAACGC TGGTAGTAAT GGCCTGTTTG CCTTCCGGCA GTTCATTAAC GCTGCTGCTT 
TTTGTTCTCT TCAGCACCAC CATTTCGGCA GTCAGTAATC TGGTGGGCAT TTTGCCTGCG 
GAAAGTTTTC CTACTGACAT TCGCTCGCTG GGCGTCGGTT TTGCCACCGC CATGAGTCGA 
CTTGGCGCGG CGGTAAGTAC TGGCCTGCTG CCGTGGGTGC TGGCGCAGTG GGGAATGCAA 
GTCACCTTAT TGCTCCTGGC GACAGTGTTG TTGGTTGGTT TTGTTGTGAC CTGGCTATGG 
GCACCAGAAA CTAAAGCCCT CCCGCTGGTG GCGGCGGGAA ATGTAGGAGG TGCGAATGAA 
CATTCTGTTA GCGTTTAA

Protein sequence

MNTSPVRMDD LPLNRFHCRI AALTFGAHLT DGYVLGVIGY AIIQLTPAMQ LTPFMAGMIG 
GSALLGLFLG SLVLGWISDH IGRQKIFTFS FLLITLASFL QFFATTPEHL IGLRILIGIG 
LGGDYSVGHT LLAEFSPRRH RGILLGAFSV VWTVGYVLAS IAGHHFISEN PEAWRWLLAS 
AALPALLITL LRWGTPESPR WLLRQGRFAE AHAIVHRYFG PHVLLGDEVV TATHKHIKTL 
FSSRYWRRTA FNSVFFVCLV IPWFVIYTWL PTIAQTIGLE DALTASLMLN ALLIVGALLG 
LVLTHLLAHR KFLLGSFLLL AATLVVMACL PSGSSLTLLL FVLFSTTISA VSNLVGILPA 
ESFPTDIRSL GVGFATAMSR LGAAVSTGLL PWVLAQWGMQ VTLLLLATVL LVGFVVTWLW 
APETKALPLV AAGNVGGANE HSVSV