Gene BCZK1128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK1128
Symbol	opuE
ID	3023010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	1231950
End bp	1233428
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	38%
IMG OID	637545361
Product	sodium/proline symporter; osmoregulated proline transporter
Protein accession	YP_082728
Protein GI	52144101
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000418657
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTACGC AGATGTTAAC TTTAACTTCT ATCTCTATTT ACATGCTCGG GATGTTAGTA 
ATTGGCTATT TTGCCTATAA ACGAACGTCC AACTTAACAG ATTATATGCT TGGCGGGCGT 
ACACTAGGTC CCGCAGTAAC GGCATTAAGT GCTGGAGCAT CCGATATGAG TGGTTGGCTT 
TTAATGGGCT TACCCGGTGC AATGTTTAGC GTTGGATTAA GTAGTAGTTG GATTGCGATC 
GGCCTAACAC TAGGCGCATA CGCAAACTGG CTATATGTCG CTCCTCGCTT ACGTACCTAC 
TCAGAAATTG CAAACAACTC TATTACTATC CCAGAATTTT TGGAACATCG CTTCCAAGAC 
AAATCCCATA TGCTACGCTT AGTATCTGGA CTTGTTATTA TGATTTTCTT TACTTTTTAT 
GTAGCTTCAG GATTAGTTTC AGGCGCTGTA TTATTTGAAA ATTCATTTGG TATGAACTAC 
CATGTTGGAT TATTCATTGT TGCAGGCGTT GTTGTAGCTT ACACGTTATT TGGGGGTTTC 
TTAGCAGTAA GTTGGACAGA CTTCGTGCAA GGAATCATTA TGGTGATTGC TCTTATTCTT 
GTTCCTACTG TTACAATTAT GAATGTAAAT GGGCTTGGTC CAGCATTTAG CACAATTAAA 
TCAATTGATC CAACATTATT AGACATTTTT AAAGGCACTT CTGTATTAGG TATTATTTCA 
TTATTCGCAT GGGGCCTTGG TTATGTTGGA CAACCACATA TTATCGTACG CTTTATGGCG 
ATTTCTTCTG TAAAAGAAAT TAAAAGTGCA AGACGAATTG GTATGAGCTG GATGATTTTC 
TCTGTTGTCG GAGCTATGTT TACTGGTCTT ATCGGTATTG CATACTACTC AGACAAAGGA 
TTAAAACTAT CCAATCCAGA GACAATTTTC CTTGAACTGG GAAAAATTTT ATTCCACCCA 
CTTATTACTG GATTTTTATT AGCCGCTATT TTAGCAGCGA TTATGAGTAC AATCTCATCT 
CAGTTACTCG TGACTTCTAG TGCCATAACT GAAGACTTAT ATCGTACTTT CTTTAAACGT 
TCTGCTTCTG ATAAAGAGCT TGTATTTGTC GGCCGTATGG CTGTACTTGT TATTGCATTA 
GTTGGATGTA CATTAGCGTT TAAACAAAAT GATACGATTT TAGCTCTTGT TGGATACGCT 
TGGGCTGGAT TTGGCTCTTC ATTCGGACCT GCTATTTTAT TAAGCTTATA TTGGAAACGT 
ATGACGAAGT GGGGCGCACT TGCTGGTATG ATTTCTGGTG CCGCTACAGT CATTATTTGG 
ACTCAATTCA AATTCTTAAA AGAATCCTTA TATGAAATGA TTCCTGGTTT CACTATTAGT 
TTACTAGTAA TCGTAATTGT TAGTTTACTA ACACAGCCTT CAAAAGAAAT TGAAGATCAA 
TTTGAGGATT TCGAAAAACA ACATAGTGAT AATCTATAA

Protein sequence

MSTQMLTLTS ISIYMLGMLV IGYFAYKRTS NLTDYMLGGR TLGPAVTALS AGASDMSGWL 
LMGLPGAMFS VGLSSSWIAI GLTLGAYANW LYVAPRLRTY SEIANNSITI PEFLEHRFQD 
KSHMLRLVSG LVIMIFFTFY VASGLVSGAV LFENSFGMNY HVGLFIVAGV VVAYTLFGGF 
LAVSWTDFVQ GIIMVIALIL VPTVTIMNVN GLGPAFSTIK SIDPTLLDIF KGTSVLGIIS 
LFAWGLGYVG QPHIIVRFMA ISSVKEIKSA RRIGMSWMIF SVVGAMFTGL IGIAYYSDKG 
LKLSNPETIF LELGKILFHP LITGFLLAAI LAAIMSTISS QLLVTSSAIT EDLYRTFFKR 
SASDKELVFV GRMAVLVIAL VGCTLAFKQN DTILALVGYA WAGFGSSFGP AILLSLYWKR 
MTKWGALAGM ISGAATVIIW TQFKFLKESL YEMIPGFTIS LLVIVIVSLL TQPSKEIEDQ 
FEDFEKQHSD NL