Gene BAS4102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4102
Symbol
ID	2852298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4031941
End bp	4033002
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	39%
IMG OID	637507339
Product	proline dipeptidase
Protein accession	YP_030352
Protein GI	49187100
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0184718
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAAAA TCGAAAGATT AAGAAGTGCA TTTGATGAGG CTGGTATTGA CGGTATTTTG 
TTAACAAATG AACATAGTCG TAGATATATG GCTAACTTCA CAGGAACAGC TGGTGTTGTC 
CTGATTTCGA AAAAACGCGC CCAATTTATT ACAGATTTCC GTTACGTAGA GCAGGCTAGT 
AAACAAGCGG TTGGATACGA GATTGTACAG CATGCAGGAT TAATTATCGA TGAAGTTGCA 
AAGCAAGTGA AAGAACTAGG AATTCAAAAG CTTGGCTTTG AGCAAGATAC TCTTACATAT 
AGTTCTTATT CAGCTCATAA AGAAGCGATC GATGCTGAAT TTATCCCAAC TTCTGGGCTT 
GTAGAAAAGT TACGCTTGAT AAAGACTGAT TCAGAGATTA AGATATTAAA GGAAGCTGCA 
CAGATTGCAG ATGCTGCCTT TGAACATATT CTATCATTCA TTCGCCCGGG AGTATCTGAA 
ATTGAAGTGT CAAATGAACT TGAATTTTTC ATGAGAAAAC AAGGAGCAAC ATCTTCTTCG 
TTTGATATTA TCGTTGCTTC AGGTCTTCGT TCGGCATTAC CGCACGGCGT GGCATCTGAA 
AAAGTGATAG AAACAGGAGA TTTCGTTACA TTAGACTTCG GCGCTTATTA CAAAGGATAT 
TGCTCTGATA TTACTCGTAC GATTGCAGTT GGTGAACCAT CTGATAAATT GAAAGAAATT 
TATAATATCG TTTTAGAAGC ACAATTACGT GGTGTGAACG GTATTAAAGC TGGTTTAACT 
GGCCGTGAAG CGGATGCGTT AACGCGTGAT TACATAACGG AAAAAGGATA CGGTGAATAC 
TTCGGACATT CTACTGGTCA TGGAATCGGT CTTGAAATCC ATGAAGCACC AGGTTTAGCA 
TTCCGTTCTG ATACAGTACT TGAACCAGGT ATGGCTGTAA CAGTAGAGCC AGGTATTTAT 
ATTCCAGGTA TTGGCGGCGT ACGTATTGAA GATGATATCA TTGTGACAAG TGAAGGTAAT 
GAAGTAATTA CGAAATCACC AAAAGAACTT ATTATTTTGT AA

Protein sequence

MEKIERLRSA FDEAGIDGIL LTNEHSRRYM ANFTGTAGVV LISKKRAQFI TDFRYVEQAS 
KQAVGYEIVQ HAGLIIDEVA KQVKELGIQK LGFEQDTLTY SSYSAHKEAI DAEFIPTSGL 
VEKLRLIKTD SEIKILKEAA QIADAAFEHI LSFIRPGVSE IEVSNELEFF MRKQGATSSS 
FDIIVASGLR SALPHGVASE KVIETGDFVT LDFGAYYKGY CSDITRTIAV GEPSDKLKEI 
YNIVLEAQLR GVNGIKAGLT GREADALTRD YITEKGYGEY FGHSTGHGIG LEIHEAPGLA 
FRSDTVLEPG MAVTVEPGIY IPGIGGVRIE DDIIVTSEGN EVITKSPKEL IIL