Gene BAS4508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4508
Symbol
ID	2850384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4423147
End bp	4424244
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	39%
IMG OID	637507746
Product	proline dipeptidase
Protein accession	YP_030756
Protein GI	49187503
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGCTA GATTAGAAAA TTTAATGCAA TGGCTAAAAG AAAAAAACGT AGAAGCTGCG 
TTCTTAACTT CTACACCAAA CGTCTTCTAC ATGACAAACT TCCACTGTGA ACCACACGAA 
AGACTTCTTG GTATGTTTGT ATTCCAAGAA AAAGAGCCTA TTTTAATTTG CCCTAAAATG 
GAAGAAGGCC AAGCACGTAA CGCCGGCTGG GCACATGAAA TTATCGGATT TACTGATACT 
GACAGACCAT GGGATATGAT TGCAAAAGCA ATTAAAGACC GCGGCATCAA TGCAAACGCA 
GTTGCAATTG AAAAAGAACT TTTAAACGTA GAGCGCTACG AAGAATTAAC AAAACTATTC 
CCAAATGCAG CTTTCACATC AGCTGAGGAA AAAGTTCGTG AACTTCGTTT AATTAAAGAT 
GAAAAAGAAC TTTCTATTTT ACGCGAAGCA GCTAAAATGG CAGACTATGC TGTTGAAGTT 
GGTGTAAATG CAATTAAAGA AGATCGTAGC GAACTAGAAG TATTAGCAAT TATTGAACAT 
GAATTAAAAA CAAAAGGCAT ACATAAAATG TCATTTGATA CGATGGTATT AGCTGGTGCA 
AACTCTGCTC TTCCACACGG TATTCCAGGT GCAAACAAAA TGAAACGCGG CGATTTCGTA 
CTATTTGATT TAGGCGTAAT CATTGACGGT TATTGCTCTG ACATTACACG TACAGTGGCA 
TTTGGCGAGA TTTCTGAAGA ACAAACTCGC ATTTACAACA CTGTACTTGC TGGACAACTA 
CAAGCAGTTG AAGCATGTAA ACCAGGTGTT ACACTTGGCG CAATCGACAA CGCTGCTCGT 
TCTGTTATCG CAGATGCAGG TTATGGTGAC TTCTTCCCGC ACCGCCTTGG TCACGGACTT 
GGAATTAGCG TGCACGAATA TCCAGATGTA AAAGCTGGTA ACGAATCTCC ATTAAAAGAA 
GGTATGGTCT TCACAATTGA GCCAGGTATT TACGTACCAA ACGTAGGTGG CGTTCGTATT 
GAAGATGATA TTTATATCAC AAAAGACGGG TCAGAAATTT TAACGAAGTT CCCGAAAGAA 
TTACAATTTG TAAAATAA

Protein sequence

MNARLENLMQ WLKEKNVEAA FLTSTPNVFY MTNFHCEPHE RLLGMFVFQE KEPILICPKM 
EEGQARNAGW AHEIIGFTDT DRPWDMIAKA IKDRGINANA VAIEKELLNV ERYEELTKLF 
PNAAFTSAEE KVRELRLIKD EKELSILREA AKMADYAVEV GVNAIKEDRS ELEVLAIIEH 
ELKTKGIHKM SFDTMVLAGA NSALPHGIPG ANKMKRGDFV LFDLGVIIDG YCSDITRTVA 
FGEISEEQTR IYNTVLAGQL QAVEACKPGV TLGAIDNAAR SVIADAGYGD FFPHRLGHGL 
GISVHEYPDV KAGNESPLKE GMVFTIEPGI YVPNVGGVRI EDDIYITKDG SEILTKFPKE 
LQFVK