Gene SbBS512_E0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E0349
Symbol
ID	6271181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	339351
End bp	340715
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	52%
IMG OID	641724587
Product	transporter, major facilitator family
Protein accession	YP_001879137
Protein GI	187730885
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGATT ATAAAATGAC GCCAGGTGAG AGGCGCGCGA CCTGGGGTTT AGGGACCGTA 
TTCTCGTTGC GCATGCTGGG CATGTTTATG GTTCTGCCGG TTCTGACCAC GTATGGCATG 
GCTCTGCAAG GTGCCAGCGA AGCATTAATC GGTATTGCCA TTGGTATTTA TGGTCTGACT 
CAGGCCGTTT TTCAGATTCC GTTTGGCCTG CTTTCCGACC GTATTGGTCG CAAACCATTA 
ATTGTCGGTG GGCTGGCGGT GTTTGCCGCC GGTAGCGTTA TCGCTGCGCT CTCTGACTCC 
ATCTGGGGAA TTATTCTGGG CCGGGCGCTA CAAGGCTCCG GTGCGATTGC CGCTGCCGTT 
ATGGCGCTGC TTTCCGATCT CACGCGCGAA CAAAACCGCA CCAAAGCAAT GGCGTTTATC 
GGCGTGAGCT TTGGCATTAC CTTTGCCATT GCGATGGTGC TTGGCCCGAT CATCACTCAC 
AAACTTGGGC TGCACGCGCT GTTCTGGATG ATCGCTATTC TGGCAACGAC CGGCATTGCG 
TTGACCATTT GGGTTGTGCC CAACAGTAGC ACTCACGTAC TTAATCGTGA GTCCGGAATG 
GTGAAAGGCA GTTTCAGTAA AGTGCTGGCG GAACCGCGGC TGCTGAAACT CAACTTTGGC 
ATTATGTGTC TGCATATTTT GCTGATGTCG ACGTTTGTTG CCCTGCCCGG ACAACTGGCT 
GATGCAGGGT TCCCGGCGGC TGAACACTGG AAGGTCTATC TGGCGACAAT GCTAATCGCC 
TTTGGCTCGG TCGTGCCTTT CATTATCTAC GCTGAAGTTA AGCGCAAAAT GAAGCAAGTC 
TTTGTCTTCT GCGTCGGGTT GATCGTGGTT GCGGAAATTG TGTTGTGGAA CGCGCAAACG 
CAGTTCTGGC AACTGGTGGT CGGCGTGCAG CTTTTCTTTG TAGCGTTTAA TTTGATGGAA 
GCCCTTCTGC CTTCACTTAT CAGTAAAGAG TCGCCAGCAG GTTACAAAGG TACAGCGATG 
GGTGTTTACT CCACCAGCCA GTTTCTTGGC GTGGCGATTG GCGGTTCACT GGGCGGCTGG 
ATTGACGGCA TGTTTGACGG TCAGGGCGTA TTTCTCGCTG GCGCAATGCT GGCCGCAGTG 
TGGCTGGCAG TCGCCAGTAC CATGAAAGAA CCGGCGTATG TCAGCAGTTT GCGCATTGAA 
ATCCCGGCGA ACATTGCCGC AAACGAGGCG TTAAAAGTGC GTTTGCTAGA AACTGAAGGC 
ATCAAAGAAG TGTTGATTGC AGAAGAAGAA CATTCAGCTT ATGTGAAAAT CGACAGCAAA 
GTGACGAATC GCTTTGATGT TGAACAGGCA ATTCGCCAGG CATAA

Protein sequence

MNDYKMTPGE RRATWGLGTV FSLRMLGMFM VLPVLTTYGM ALQGASEALI GIAIGIYGLT 
QAVFQIPFGL LSDRIGRKPL IVGGLAVFAA GSVIAALSDS IWGIILGRAL QGSGAIAAAV 
MALLSDLTRE QNRTKAMAFI GVSFGITFAI AMVLGPIITH KLGLHALFWM IAILATTGIA 
LTIWVVPNSS THVLNRESGM VKGSFSKVLA EPRLLKLNFG IMCLHILLMS TFVALPGQLA 
DAGFPAAEHW KVYLATMLIA FGSVVPFIIY AEVKRKMKQV FVFCVGLIVV AEIVLWNAQT 
QFWQLVVGVQ LFFVAFNLME ALLPSLISKE SPAGYKGTAM GVYSTSQFLG VAIGGSLGGW 
IDGMFDGQGV FLAGAMLAAV WLAVASTMKE PAYVSSLRIE IPANIAANEA LKVRLLETEG 
IKEVLIAEEE HSAYVKIDSK VTNRFDVEQA IRQA