Gene BCZK5056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK5056
Symbol
ID	3022987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	+
Start bp	5168746
End bp	5170146
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	39%
IMG OID	637549289
Product	aminopeptidase
Protein accession	YP_086626
Protein GI	52140205
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.418047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT CTTTGAAACA AAAAATAGTA AGCTCCTTGC TTGCTGTATC ACTCGCTGTT 
AGCTTAGCTC CGATTGGACA AGCTAAAGCT GATTCCACGT CAGAAATCAA GCAGACTTCA 
TCTATCACAA AACAAGTTGA TGCAAGCCGC GCTATCGAAC ACATCCGTTT CTTATCCGAA 
ACAATTGGTC CTCGACCTGG CGGGACAAAA TCAGAAGAAT GGGCTTCCCG CTACGTTGGT 
ATGCAGCTTA AATCAATGGG CTACGAAGTA GAATATCAAC CATTCCAAGT GCCGGATCAA 
TACGTTGGAT TTATTGAATC ACCATTATCC ACAAAGCGTA ATTGGCAAGC TGGTGCTGCC 
CCTAACGCAC TAATTTCTAC AGAATCTGTT ACAGCTCCTC TTATCTTTGT TCAAGGTGGG 
ACAAAATTAG AGGATATCCC AAATGAAGTA AATGGAAAAA TTGTTCTATT CGAAAGAGGA 
ACAACAGTAG CTGACTATAA TAAACAAGTT GAAAATGCTG TTAGCAAAGG AGCAAAAGGT 
GTTCTTTTAT ACAGTTTAAT TGGTGGACGT GGAAACTACG GACAAACTTT CAATCCCCGC 
CTAACGAAAA AGCAATCTAT CCCTGTCTTT GGTCTTGCTT ATGCGCAAGG AAATGCATTT 
AAAGAAGAAA TCGCTAAAAA AGGAACAACA ATTCTTTCCC TAAAAGCGAG ACATGAATCT 
AATTTAACAT CATTAAACGT CATCGCTAAA AAGAAACCAA AAAACAGTAC AGGTAATGAA 
AAAGCTGTCG TTGTAAGTTC ACACTACGAT AGTGTCGTTG GAGCACCTGG AGCAAATGAT 
AATGCTTCTG GTACAGGATT AGTATTAGAA TTAGCTCGTG CTTTTCAAAA TGTAGAAACT 
GATAAGGAAA TTCGTTTTAT TGCTTTTGGT TCTGAAGAGA CTGGCTTACT TGGCTCCGAT 
TATTACGTTA ATAGTTTATC CCAAAAAGAA CGCGATCGAA TTTTAGGTGT CTTTAACGCA 
GACATGGTCG CAACAAATTA CGATAAAGCA AAGAATCTAT ATGCTATGAC GCCTAACGGT 
TCTCCAAACC TTGTAACAGA CGCAGCCTTA CAAGCAGGTA AACAGTTAAA TAATGACCTT 
GTACTGCAAG GAAAATTCGG CTCTAGTGAT CACGTCCCAT TTGCTGAAGT TGGCATTCCT 
GCCGCTCTAT TTATTTGGAT GGGTGTCGAT AGCTGGAATC CATTAATCTA TCATATCGAG 
AAGGTATATC ACACACCTCA AGATAACGTA TTTGAGAACA TTTCACCTGA ACGTATGAAA 
ATGGCACTAG AAGTAATCGG AACTGGTGTT TATAACACTC TTCAAAAACC TGTTACGCAA 
ACCGAACAGA AAGCTGCTTA A

Protein sequence

MKKSLKQKIV SSLLAVSLAV SLAPIGQAKA DSTSEIKQTS SITKQVDASR AIEHIRFLSE 
TIGPRPGGTK SEEWASRYVG MQLKSMGYEV EYQPFQVPDQ YVGFIESPLS TKRNWQAGAA 
PNALISTESV TAPLIFVQGG TKLEDIPNEV NGKIVLFERG TTVADYNKQV ENAVSKGAKG 
VLLYSLIGGR GNYGQTFNPR LTKKQSIPVF GLAYAQGNAF KEEIAKKGTT ILSLKARHES 
NLTSLNVIAK KKPKNSTGNE KAVVVSSHYD SVVGAPGAND NASGTGLVLE LARAFQNVET 
DKEIRFIAFG SEETGLLGSD YYVNSLSQKE RDRILGVFNA DMVATNYDKA KNLYAMTPNG 
SPNLVTDAAL QAGKQLNNDL VLQGKFGSSD HVPFAEVGIP AALFIWMGVD SWNPLIYHIE 
KVYHTPQDNV FENISPERMK MALEVIGTGV YNTLQKPVTQ TEQKAA