Gene BAS4052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4052
Symbol
ID	2851068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3986067
End bp	3987185
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	38%
IMG OID	637507289
Product	peptidase T
Protein accession	YP_030302
Protein GI	49187050
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01883] peptidase T-like protein

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAATC AAGAACGTTT AGTAAATGAA TTCATGGAAT TAGTACAAGT AGATTCTGAA 
ACGAAATTTG AAGCAGAAAT TTGCAAAGTA TTAACAAAGA AATTTACAGA TTTAGGTGTA 
GAAGTATTTG AAGATGACAC AATGGCTGTT ACTGGGCATG GTGCAGGTAA CTTAATTTGT 
ACATTACCAG CAACAAAAGA TGGTGTTGAT ACAATTTACT TTACTTCTCA TATGGATACA 
GTAGTTCCTG GTAATGGAAT TAAGCCTTCT ATTAAAGATG GATATATCGT ATCAGATGGT 
ACTACGATTT TAGGTGCGGA TGATAAAGCG GGATTAGCAT CAATGTTTGA AGCAATCCGT 
GTTTTAAAAG AGAAAAATAT CCCTCACGGC ACAATTGAAT TTATTATTAC AGTTGGAGAA 
GAATCTGGTC TTGTTGGTGC AAAAGCATTA GATCGTGAGC GCATTACAGC GAAATATGGT 
TACGCGTTAG ATAGCGATGG GAAAGTTGGC GAAATCGTTG TTGCAGCTCC AACACAAGCG 
AAAGTGAACG CGATTATTCG CGGGAAAACA GCTCATGCAG GTGTAGCACC GGAAAAAGGC 
GTATCTGCAA TTACGATCGC AGCGAAAGCA ATTGCGAAGA TGCCACTTGG TCGTATTGAT 
TCTGAAACAA CTGCAAATAT TGGACGTTTT GAAGGTGGTA CACAAACGAA TATCGTTTGC 
GATCATGTAC AAATCTTTGC AGAAGCGCGT TCTTTAATCA ATGAAAAAAT GGAAGTACAA 
GTTGCGAAAA TGAAAGAAGC ATTTGAAACA ACTGCAAAAG AAATGGGCGG CCAAGCAGAT 
GTTGAAGTAA AGGTTATGTA CCCAGGATTT AAATTTGCTG ATGGGGATCA CGTTGTAGAA 
GTTGCAAAAC GCGCAGCTGA AAAAATTGGT CGTACACCTT CTCTTCACCA AAGTGGTGGC 
GGAAGTGATG CAAACGTAAT TGCTGGACAC GGAATTCCAA CAGTTAACTT AGCAGTTGGT 
TATGAAGAAA TTCATACAAC AAACGAAAAG ATTCCTGTTG AAGAATTAGC GAAAACAGCA 
GAATTAGTTG TTGCAATCAT AGAGGAAGTA GCGAAATAA

Protein sequence

MINQERLVNE FMELVQVDSE TKFEAEICKV LTKKFTDLGV EVFEDDTMAV TGHGAGNLIC 
TLPATKDGVD TIYFTSHMDT VVPGNGIKPS IKDGYIVSDG TTILGADDKA GLASMFEAIR 
VLKEKNIPHG TIEFIITVGE ESGLVGAKAL DRERITAKYG YALDSDGKVG EIVVAAPTQA 
KVNAIIRGKT AHAGVAPEKG VSAITIAAKA IAKMPLGRID SETTANIGRF EGGTQTNIVC 
DHVQIFAEAR SLINEKMEVQ VAKMKEAFET TAKEMGGQAD VEVKVMYPGF KFADGDHVVE 
VAKRAAEKIG RTPSLHQSGG GSDANVIAGH GIPTVNLAVG YEEIHTTNEK IPVEELAKTA 
ELVVAIIEEV AK