Gene BCZK3635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK3635
Symbol	pepQ
ID	3026891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	+
Start bp	3775357
End bp	3776427
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	35%
IMG OID	637547851
Product	proline dipeptidase
Protein accession	YP_085217
Protein GI	52141612
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTTAA AAATTAATAA AATCCAAAAT CAACTACAGA ACTATGAAAT TGACGGGTTA 
CTCATTACAA AAAAAGAAAA TCGCCAATAT GCGACAGGCT TTACAGGTAG TGCTGGTGTT 
GTCTTAATCT CTGCGGATGC AGCTGTTTTT ATAACTGATT TCCGCTATGT AGACCAAGCG 
AATTCACAAA TAAAAAATGC TGAAATTATT ATGCATAAAG GAAATTTAGA AAAAGAAATT 
GCAAATCAAG TATCGAAATT AAACATTCAA AAACTTGGAA TTGAAGAAAA TAATATGACA 
TTGCAACAAT ATAAAAACTT ACAAAAATAT GTACATACGG AAATGGTTCA AGTGTGTGAA 
ATCATTGAAA ACATTCGTCT TATTAAAGAC ACTCATGAAA TAGAAACAAT GAAAATCGCA 
GCTAATATTG CGGACGAAGC ATTTCACCAC ATCATTACGT TTCTAAAACC AGGAATAAGT 
GAAAATGATG TACGAGATGA GTTAGAATTT TTCATGCGAA AAAAAGGGGC TACGTCCTCT 
TCATTCCAAA TCATTGTAGC TTCTGGCGTT CGTTCTTCAC TTCCTCATGG AGTTGCATCA 
AATAAAATAA TTGAACGAGG CGACATCGTT ACATTAGATT TCGGTGCACT TTACGACGGA 
TATTGTTCCG ATATAACACG TACTGTAGCA ATCGGGGAAC CACCAGAAGA GTTCAAAAAA 
ATATACAGTG TTGTACGCGA AGCATTAAAA CGCGGGACTG AAGCAATTAA GCCTGGAGAA 
ACTGCGAAAC GTATCGATGA TATAACGAGA AACTATATTA TAGAACATGG ATACGGTCAA 
TATTTTGGAC ATTCTACTGG TCATGGTCTT GGATTAGAAA TTCATGAACC ACTTCGCCTA 
TCCCAAGAAA GTAAGGCTAT TTTAGAAGAA GGTATGGTCG TTACCATTGA ACCAGGTATT 
TACATACCAA ACTGGGGCGG TTGTAGAATT GAAGATGATA TCGTCATTAC AGAAGATGGA 
TATGAAGTTA TTACAAAATC AAATAGAGAT CTAATTATAA TCCCTTGTTA A

Protein sequence

MTLKINKIQN QLQNYEIDGL LITKKENRQY ATGFTGSAGV VLISADAAVF ITDFRYVDQA 
NSQIKNAEII MHKGNLEKEI ANQVSKLNIQ KLGIEENNMT LQQYKNLQKY VHTEMVQVCE 
IIENIRLIKD THEIETMKIA ANIADEAFHH IITFLKPGIS ENDVRDELEF FMRKKGATSS 
SFQIIVASGV RSSLPHGVAS NKIIERGDIV TLDFGALYDG YCSDITRTVA IGEPPEEFKK 
IYSVVREALK RGTEAIKPGE TAKRIDDITR NYIIEHGYGQ YFGHSTGHGL GLEIHEPLRL 
SQESKAILEE GMVVTIEPGI YIPNWGGCRI EDDIVITEDG YEVITKSNRD LIIIPC