Gene BCZK3347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK3347
Symbol	opuE
ID	3027023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	3478588
End bp	3480069
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	37%
IMG OID	637547566
Product	sodium/proline symporter
Protein accession	YP_084932
Protein GI	52141901
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTGAAGA TTGAGATTAT GGTTTCGCTT GCTATTTATA TGGCAGGTAT GTTGTATATC 
GGGTATTGGT CTTATAAGAA GACATCCGAT TTATCAGATT ATATGTTAGG CGGAAGAGGA 
CTCGGTCCAG CAGTTACAGC TTTATCAGCC GGTGCTTCTG ACATGAGTGG TTGGATGCTT 
ATGGGATTAC CGGGTGCGAT GTATGCGACA GGGTTGTCCA GTGTATGGAT CGCGATAGGT 
TTATTAATAG GCGCTTATGC AAACTATTTA ATTCTCGCGC CGCGTTTACG AACATATACG 
GAAGTAGCAA ATGATTCAAT TACGATTCCA GATTTTTTAG AGAATCGGTT TAAAGATCGT 
ACGAAAATAC TTCGTTTTGT CTCCGCTATC GTCATTTTAG TATTTTTCAC ATTTTATGCG 
TCAGCTGGTT TGGTTTCAGG TGGACGTTTG TTTGAAAATT CTTTTAACCT TGATTATAAA 
ATTGGTTTAT TTGTAACTGT CGGTGTCGTT GTTGCTTATA CACTATTCGG TGGTTTTTTA 
GCAGTAAGTT GGACCGACTT TGTGCAAGGT TGTATTATGT TTATTGCTCT TGTATTAGTT 
CCAATTGTAG CTTTTACAGA TGTCGGTGGT GTAACAGAAA CATTCAATAC AATTAAGCAA 
GTTGATGCAT CGCATTTAGA TATGTTTAAA GGGACTACAA TACTTGGCAT TATTTCATTT 
TTAGCATGGG GCCTTGGGTA TTTTGGTCAA CCACATATTA TTGTCCGCTT TATGGCAATT 
ACCTCTATTA AAGATTTAAA AACTTCTCGT AGAATCGGTA TCGGTTGGAT GACGATTTCA 
ATTATAGGTG CAATGCTTAC TGGTCTAGTT GGTATTGCTT ATTACGCTAA AAATAATGCG 
ACATTACAAG ATCCGGAAAT GGTCTTTGTA ACATTCTCAA ATATTTTATT CCATCCGTAC 
ATTACTGGAT TTTTATTATC AGCTATTTTG GCTTCGATTA TGAGTAGTAT TTCCTCGCAA 
TTACTTGTTA TTTCAAGTGC TGTAACGGAA GATTTCTATA AAACATTTTT CCGTCGTAAA 
GCAAGTGATA AAGAACTTGT ATTTATCGGT AGGCTGTCAG TATTAGTAGT AGCGATGATT 
GCAGTTGTTT TAGCGTATCA TCCGAGTGAT ACAATTTTAA CGCTTGTTGG ATATGCTTGG 
GCAGGATTTG GATCAGCATT CGGACCAGCA ATTTTATTAA GTTTATATTG GAAGAGAACG 
AACAAATGGG GCGTTCTTGC TGGGATGATT GTCGGTGCAT TAGTTGTTAT CACTTGGGTA 
CAAATTCCAA GTTTAAAAGC GACTATGTAT GAGATGGTAC CTGGATTCTT CTGTAGCTTA 
TTAGCTGTTA TTATCGTAAG TTTAGTAACG AAAGAACCAG TTAAAGCAAT ACATCGTGAA 
TTTAATGAGA TGGAAGCAGT ATTGGAAGAG GAAACAAAAT AA

Protein sequence

MVKIEIMVSL AIYMAGMLYI GYWSYKKTSD LSDYMLGGRG LGPAVTALSA GASDMSGWML 
MGLPGAMYAT GLSSVWIAIG LLIGAYANYL ILAPRLRTYT EVANDSITIP DFLENRFKDR 
TKILRFVSAI VILVFFTFYA SAGLVSGGRL FENSFNLDYK IGLFVTVGVV VAYTLFGGFL 
AVSWTDFVQG CIMFIALVLV PIVAFTDVGG VTETFNTIKQ VDASHLDMFK GTTILGIISF 
LAWGLGYFGQ PHIIVRFMAI TSIKDLKTSR RIGIGWMTIS IIGAMLTGLV GIAYYAKNNA 
TLQDPEMVFV TFSNILFHPY ITGFLLSAIL ASIMSSISSQ LLVISSAVTE DFYKTFFRRK 
ASDKELVFIG RLSVLVVAMI AVVLAYHPSD TILTLVGYAW AGFGSAFGPA ILLSLYWKRT 
NKWGVLAGMI VGALVVITWV QIPSLKATMY EMVPGFFCSL LAVIIVSLVT KEPVKAIHRE 
FNEMEAVLEE ETK