Gene SbBS512_E4854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4854
Symbol
ID	6268781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	4526070
End bp	4527095
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	57%
IMG OID	641728592
Product	putative sugar ABC transporter, permease protein
Protein accession	YP_001882986
Protein GI	187731371
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGCCTC AATCTCTTCC GGACACCACT ACGCCAAAAA GGCGCTTTCG CTGGCCGACG 
GGGATGCCGC AGCTGGTAGC ACTATTGCTG GTGCTGCTGG TCGACAGCCT GGTAGCCCCG 
CATTTCTGGC AGGTAGTGCT TCAGGATGGG CGTTTGTTCG GTAGCCCCAT AGACATTCTT 
AACCGTGCAG CCCCCGTTGC GTTACTGGCG ATTGGTATGA CGCTGGTGAT CGCCACCGGT 
GGGATTGATC TCTCCGTAGG GGCGGTGATG GCTATCGCCG GAGCCACAAC GGCTGCGATG 
ACGGTCGCGG AAGTCAGCCT GCCGATTGTT TTGTTAAGCG CCCTGGGCAC CGGCATCCTG 
GCGGGATTGT GGAACGGCAT ACTGGTAGCG ATCCTCAAAA TTCAGCCATT TGTCGCCACC 
CTGATCCTGA TGGTCGCCGG GCGCGGCGTG GCGCAACTGA TCACCTCCGG ACAGATCGTC 
ACGTTTAACT CGCCGGATCT CTCATGGTTT GGCAGTGGAT CGCTGTTGTT CCTGCCAACG 
GCAGTCATTA TTGCGGTACT GACGCTTCTC CTGTTCTGGC TGTTGACCCG CAAAACGGCA 
CTGGGGATGT TTATCGAAGC CGTTGGTATC AACATTCGGG CGGCAAAAAA TGCCGGGGTA 
AACACGCGGA TCATCGTCAT GCTCACTTAT GTGTTGAGCG GGCTGTGTGC GGCGATTGCG 
GGCATTATCG TGGCGGCGGA TATTCGCGGT GCCGATGCCA ACAACGCCGG ATTATGGCTG 
GAGCTGGACG CCATTCTCGC GGTGGTGATT GGCGGCGGAT CGCTGATGGG CGGGCGCTTT 
AACCTGCTGC TCTCGGTAGT GGGGGCGCTG ATTATTCAGG GGATGAACAC CGGAATTTTG 
CTTTCGGGCT TTCCACCGGA GATGAACCAG GTGGTGAAAG CGGTGGTGGT GCTTTGCGTG 
CTGATTGTCC AGTCGCAACG CTTTATCAGT CTGATTAAAG GAGTACGTAG CCGTGATAAA 
ACGTAA

Protein sequence

MMPQSLPDTT TPKRRFRWPT GMPQLVALLL VLLVDSLVAP HFWQVVLQDG RLFGSPIDIL 
NRAAPVALLA IGMTLVIATG GIDLSVGAVM AIAGATTAAM TVAEVSLPIV LLSALGTGIL 
AGLWNGILVA ILKIQPFVAT LILMVAGRGV AQLITSGQIV TFNSPDLSWF GSGSLLFLPT 
AVIIAVLTLL LFWLLTRKTA LGMFIEAVGI NIRAAKNAGV NTRIIVMLTY VLSGLCAAIA 
GIIVAADIRG ADANNAGLWL ELDAILAVVI GGGSLMGGRF NLLLSVVGAL IIQGMNTGIL 
LSGFPPEMNQ VVKAVVVLCV LIVQSQRFIS LIKGVRSRDK T