Gene BCAH187_A4742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCAH187_A4742
Symbol	pepQ2
ID	7077802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus AH187
Kingdom	Bacteria
Replicon accession	NC_011658
Strand	+
Start bp	4400415
End bp	4401512
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	39%
IMG OID	643453154
Product	X-Pro dipeptidase
Protein accession	YP_002340665
Protein GI	217962095
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.928976
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCTA GATTAGAAAA TTTAATGCAA TGGCTAAAAG AAAAAAACGT AGAAGCTGCG 
TTCTTAACTT CTACACCAAA CGTCTTCTAC ATGACAAACT TCCACTGTGA ACCACACGAA 
AGACTTCTTG GTATGTTTGT ATTCCAAGAA AAAGAACCTA TTTTAATTTG CCCTAAAATG 
GAAGAAGGCC AAGCACGTAA CGCTGGCTGG GCACATGAAA TTATCGGATT TACTGATACT 
GACAGACCAT GGGATATGAT TGCAAAAGCA ATTAAAGACC GCGGTATCAA TGCAAATGCA 
GTTGCAATTG AAAAAGAACA TTTAAACGTA GAGCGCTACG AAGAATTAAC AAAATTATTC 
CCAAATGCAG CTTTCACGTC AGCTGAGGAA AAAGTTCGTG AACTTCGTTT AATTAAAGAC 
GAAAAAGAAC TTTCTATTTT ACGCGAAGCA GCTAAAATGG CAGACTATGC TGTTGAAGTT 
GGTGTAAATG CAATTAAAGA AGATCGTAGC GAACTAGAAG TATTAGCAAT TATTGAACAC 
GAATTAAAAA CAAAAGGCAT ACATAAAATG TCATTTGATA CGATGGTATT AGCTGGTGCA 
AACTCTGCTC TTCCACACGG TATTCCAGGT GCAAACAAAA TGAAACGCGG CGATTTCGTA 
CTATTTGATT TAGGCGTAAT CATTGATGGC TATTGCTCTG ACATTACACG TACAGTAGCA 
TTCGGCGAGA TTTCTGAAGA ACAAACTCGT ATTTACAACA CTGTACTTGC TGGACAACTA 
CAAGCAGTTG AAGCATGTAA ACCAGGTGTT ACGCTTGGCA CAATCGACAA CGCTGCTCGT 
TCTGTTATCG CAGATGCAGG TTACGGCGAC TTCTTCCCGC ACCGTCTTGG TCACGGACTT 
GGAATTAGCG TACATGAATA TCCAGATGTA AAAGCTGGCA ACGAATCTCC ATTAAAAGAA 
GGTATGGTCT TCACAATCGA GCCAGGTATT TACGTACCAA ACGTAGGTGG TGTTCGTATT 
GAAGATGATA TTTATATCAC AAAAGACGGA TCAGAAATTT TAACGAAATT CCCGAAAGAA 
TTACAATTTG TAAAATAA

Protein sequence

MNARLENLMQ WLKEKNVEAA FLTSTPNVFY MTNFHCEPHE RLLGMFVFQE KEPILICPKM 
EEGQARNAGW AHEIIGFTDT DRPWDMIAKA IKDRGINANA VAIEKEHLNV ERYEELTKLF 
PNAAFTSAEE KVRELRLIKD EKELSILREA AKMADYAVEV GVNAIKEDRS ELEVLAIIEH 
ELKTKGIHKM SFDTMVLAGA NSALPHGIPG ANKMKRGDFV LFDLGVIIDG YCSDITRTVA 
FGEISEEQTR IYNTVLAGQL QAVEACKPGV TLGTIDNAAR SVIADAGYGD FFPHRLGHGL 
GISVHEYPDV KAGNESPLKE GMVFTIEPGI YVPNVGGVRI EDDIYITKDG SEILTKFPKE 
LQFVK