Gene SbBS512_E4129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4129
Symbol
ID	6272853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3850147
End bp	3851397
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	53%
IMG OID	641727957
Product	polysaccharide biosynthesis protein
Protein accession	YP_001882384
Protein GI	187731867
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.924452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTTGG CAAAAGCGTC CTTGTGGACG GCGGCCAGTA CACTGGTCAA GATTGGTGCC 
GGGTTACTGG TCGGTAAGTT GCTGGCGGTG TCATTTGGTC CGGCGGGGCT TGGGCTGGCG 
GCAAATTTCC GCCAGTTGAT TACCGTGCTC GGCGTGCTTG CCGGGGCTGG CATCTTTAAC 
GGTGTAACCA AATACGTTGC CCAGTACCAT GATAATCCGC AACAGCTGCG CCGCGTGGTC 
GGCACTTCAT CAGCGATGGT ACTTGGTTTC TCTACGCTGA TGGCGCTGGT TTTTGTGCTG 
GCAGCTGCGC CAATCAGCCA GGGATTGTTT GGTAATACCG ACTATCAGGG GCTGGTGCGT 
TTAGTGGCGC TGGTGCAAAT GGGGATCGCC TGGGGCAACC TGTTACTGGC GCTGATGAAA 
GGCTTTCGCG ATGCCGCAGG TAATGCGTTA TCGCTGATTG TCGGCAGCTT GATTGGCGTT 
CTCGCGTACT ACGTCAGTTA CCGTTTGGGC GGTTATGAAG GGGCGTTGCT GGGTCTGGCG 
CTGATTCCCG CGCTGGTGGT AATTCCTGCC GCCATCATGT TGATCAAACG TGGTGTCATC 
CCGTTAAGCT ATCTGAAACC CAGCTGGGAT AACGGTCTGG CAGGGCAGTT GAGCAAATTT 
ACGCTCATGG CGTTGATTAC GTCGGTGACC TTGCCTGTTG CTTACATCAT GATGCGTAAA 
CTGCTGGCGG CGCAGTATAG CTGGGATGAA GTGGGGATCT GGCAAGGGGT GAGCAGTATT 
TCCGATGCCT ACCTGCAATT CATTACGGCA TCGTTCAGCG TATATTTGCT GCCCACGTTG 
TCGCGGCTAA CGGAAAAGCG CGATATCACC CGGGAAGTGG TTAAATCGCT AAAATTCGTC 
TTACCGGCAG TGGCGGCGGC GAGTTTTACC GTCTGGTTGC TGCGTGATTT TGCTATCTGG 
TTGCTGTTGT CGAATAAATT TACCGCTATG CGCGATCTCT TTGCCTGGCA GTTAGTGGGT 
GATGTGTTAA AAGTGGGCGC TTATGTCTTT GGTTATCTGG TGATCGCCAA AGCGTCACTG 
CGGTTTTATA TTCTGGCGGA AGTCAGCCAG TTCACTTTAT TGATGGTATT TGCCCACTGG 
CTAATCCCTG CGCATGGTGC ACTGGGCGCG GCGCAGGCAT ATATGGCAAC TTATATCGTC 
TATTTTTCTC TTTGTTGTGG CGTGTTTTTA CTCTGGCGTA GGCGGGCATG A

Protein sequence

MSLAKASLWT AASTLVKIGA GLLVGKLLAV SFGPAGLGLA ANFRQLITVL GVLAGAGIFN 
GVTKYVAQYH DNPQQLRRVV GTSSAMVLGF STLMALVFVL AAAPISQGLF GNTDYQGLVR 
LVALVQMGIA WGNLLLALMK GFRDAAGNAL SLIVGSLIGV LAYYVSYRLG GYEGALLGLA 
LIPALVVIPA AIMLIKRGVI PLSYLKPSWD NGLAGQLSKF TLMALITSVT LPVAYIMMRK 
LLAAQYSWDE VGIWQGVSSI SDAYLQFITA SFSVYLLPTL SRLTEKRDIT REVVKSLKFV 
LPAVAAASFT VWLLRDFAIW LLLSNKFTAM RDLFAWQLVG DVLKVGAYVF GYLVIAKASL 
RFYILAEVSQ FTLLMVFAHW LIPAHGALGA AQAYMATYIV YFSLCCGVFL LWRRRA