Gene SbBS512_E1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1854
Symbol
ID	6269438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	1697290
End bp	1698459
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	53%
IMG OID	641725919
Product	transporter, major facilitator family
Protein accession	YP_001880417
Protein GI	187730588
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000000789042
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTA ACTATCCGTT GCTGGCGCTG GCGATTGGCG CGTTTGGTAT CGGGACAACG 
GAGTTCTCGC CAATGGGCTT GTTGCCCGTC ATTGCGCGCG GTGTGGATGT CTCGATTCCC 
GCTGCCGGAA TGTTAATCAG TGCCTATGCA GTTGGCGTAA TGGTTGGCGC GCCGCTGATG 
ACGCTTCTAC TTTCTCATCG TGCCCGCCGC AGTGCGTTGA TTTTCCTGAT GGCAATTTTC 
ACGCTCGGCA ACGTACTTTC CGCCATCGCG CCGGATTATA TGACCCTGAT GCTTTCACGC 
ATTTTGACCA GCCTGAATCA CGGAGCATTT TTTGGTTTGG GTTCAGTCGT GGCCGCAAGC 
GTGGAGCCAA AACATAAACA GGCCAGCGCA GTTGCCACTA TGTTTATGGG GTTAACCCTG 
GCAAATATCG GTGGCGTGCC GGCGGCGACC TGGTTGGGTG AAACCATCGG CTGGCGGATG 
TCATTTCTGG CAACGGCGGG GCTGGGAGTG ATTTCAATGG TAAGTCTGTT CTTCTCATTA 
CCTAAAGGTG GTGCAGGGGC ACGACCTGAA GTGAAAAAAG AGCTGGCGGT ATTAATGCGT 
CCGCAGGTGC TGTCTGCATT GCTGACGACG GTACTGGGAG CTGGTGCAAT GTTTACTCTC 
TACACCTATA TCTATCCGGT ACTGCAAAGT ATTACCCACG CAACACCGGT GTTCGTCACG 
GCAATGCTGG TGCTGATTGG TGTCGGATTC TCTATCGGTA ACTATCCCGG CGGCAAACTG 
GCAGATCGTT CAGTTAACGG CACGTTGAAA GGCTTTTTGT TGTTGTTGAT GGTGATTATG 
CTGGCAATCC CGTTCCTGGC CCGCAATGAG TTCGGCGCAG CTATTAGCAT GGTGGTGTGG 
GGCGCAGCAA CCTTTGCGGT CGTACCGCCG TTACAGATGC GCGTGATGCG TGTCGCCAGT 
GAAGCGCCAG GTCTGTCTTC ATCAGTCAAT ATTGGTGCCT TTAATCTTGG AAATGCGCTG 
GGAGCAGCTG CTGGTGGTGC GGTAATTTCC GCTGGGCTGG GATACAGCTT TGTGCCGGTG 
ATGGGAGCGA TTGTCGCGGG ACTGGCATTA TTGCTGGTGT TTATGTCAGC CAGAAAACAA 
CCTGAAACAG TTTGCGTTGC TAACAGCTAA

Protein sequence

MKINYPLLAL AIGAFGIGTT EFSPMGLLPV IARGVDVSIP AAGMLISAYA VGVMVGAPLM 
TLLLSHRARR SALIFLMAIF TLGNVLSAIA PDYMTLMLSR ILTSLNHGAF FGLGSVVAAS 
VEPKHKQASA VATMFMGLTL ANIGGVPAAT WLGETIGWRM SFLATAGLGV ISMVSLFFSL 
PKGGAGARPE VKKELAVLMR PQVLSALLTT VLGAGAMFTL YTYIYPVLQS ITHATPVFVT 
AMLVLIGVGF SIGNYPGGKL ADRSVNGTLK GFLLLLMVIM LAIPFLARNE FGAAISMVVW 
GAATFAVVPP LQMRVMRVAS EAPGLSSSVN IGAFNLGNAL GAAAGGAVIS AGLGYSFVPV 
MGAIVAGLAL LLVFMSARKQ PETVCVANS