Gene SbBS512_E3201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3201
Symbol	proW
ID	6273288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2986679
End bp	2987743
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	58%
IMG OID	641727116
Product	glycine betaine transporter membrane protein
Protein accession	YP_001881570
Protein GI	187731166
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4176] ABC-type proline/glycine betaine transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGATC AAAATAATCC GTGGGATACC ACGCCAGCGG CGGACAGTGC CGTGCAATCC 
GCAGACGCCT GGGGTACACC GGCGACTGCA CCGACTGACG GCGGTGGTGC TGACTGGCTG 
ACCAGTACGC CTGCGCCAAA CGTCGAGCAT TTTAATATTC TCGATCCGTT CCATAAAACG 
CTGATCCCGC TCGACAGTTG GGTCACTGAA GGGATCGACT GGGTTGTTAC CCATTTCCGT 
CCCGTCTTCC AGGGCGTGCG CGTTCCGGTT GATTATATCC TCAACGGTTT CCAGCAATTG 
CTGCTGGGTA TGCCCGCACC GGTGGCGATT ATCGTTTTCG CTCTCATCGC CTGGCAGATT 
TCCGGGGTCG GAATGGGCGT GGCGACGCTG GTTTCGCTGA TTGCCATCGG CGCAATCGGT 
GCCTGGTCGC AGGCCATGGT TACCCTGGCG CTGGTGTTAA CCGCCCTGCT GTTCTGTATC 
GTCATTGGTT TGCCGCTGGG GATCTGGCTG GCGAGAAGTC CGCGAGCGGC GAAAATTATT 
CGTCCACTGC TTGATGCCAT GCAGACCACG CCAGCGTTTG TTTATCTGGT GCCAATCGTC 
ATGCTATTTG GTATCGGTAA CGTGCCGGGC GTGGTGGTGA CGATCATCTT TGCTCTGCCG 
CCGATTATCC GTCTGACCAT TCTGGGGATT AACCAGGTTC CGGCGGATCT GATTGAAGCC 
TCGCGCTCAT TCGGTGCCAG CCCGCGCCAG ATGCTGTTCA AAGTTCAGTT ACCGCTGGCG 
ATGCCGACCA TTATGGCGGG CGTTAACCAG ACGCTGATGC TGGCCCTTTC TATGGTGGTC 
ATTGCCTCGA TGATTGCCGT CGGCGGGCTG GGTCAGATGG TACTTCGCGG TATCGGTCGT 
CTGGATATGG GGCTTGCCAC CGTTGGCGGC GTCGGGATTG TGATCCTCGC CATTATCCTC 
GATCGCCTGA CGCAGGCCGT TGGGCGCGAC TCACGCAGTC GCGGCAACCG TCGCTGGTAC 
ACCACTGGCC CTGTTGGTCT GCTGACCCGC CCATTCATTA AGTAA

Protein sequence

MADQNNPWDT TPAADSAVQS ADAWGTPATA PTDGGGADWL TSTPAPNVEH FNILDPFHKT 
LIPLDSWVTE GIDWVVTHFR PVFQGVRVPV DYILNGFQQL LLGMPAPVAI IVFALIAWQI 
SGVGMGVATL VSLIAIGAIG AWSQAMVTLA LVLTALLFCI VIGLPLGIWL ARSPRAAKII 
RPLLDAMQTT PAFVYLVPIV MLFGIGNVPG VVVTIIFALP PIIRLTILGI NQVPADLIEA 
SRSFGASPRQ MLFKVQLPLA MPTIMAGVNQ TLMLALSMVV IASMIAVGGL GQMVLRGIGR 
LDMGLATVGG VGIVILAIIL DRLTQAVGRD SRSRGNRRWY TTGPVGLLTR PFIK