Gene BAS4277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4277
Symbol
ID	2852761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4187598
End bp	4188878
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	38%
IMG OID	637507513
Product	U32 family peptidase
Protein accession	YP_030525
Protein GI	49187273
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGTAC AAGAAATTTC ACGAGTAATC GATGGCAAAC GCGTTATTGT GAAGAAACCT 
GAACTGTTAA TCCCTGCGGG TAACTTAGAA AAATTAAAAG TAGCTATCCA TTACGGGGCA 
GATGCTGTAT ATTTAGGTGG ACAAGAATTT GGTCTTCGTT CGAATGCAGG TAACTTTACA 
CTGGAAGAAA TGGCAGAAGG TGTGGAATTC GCAAAGAAAT ATGGAGCGAA AATATATGTA 
ACAACAAATA TCTTTGCGCA TAATGAAAAT ATGGACGGGC TAGAGGAATA TTTAAAAGGG 
ATTGAAAAAG CTGGCGTAAC GGGAATTATC GTTGCTGATC CGCTTATTAT TGAGACTTGT 
AAACGTGTAG CACCTTCTGT TGAGGTGCAT TTAAGTACAC AACAATCACT ATCCAACTGG 
AAAGCAGCAC AGTATTGGAA AGAAGAAGGT TTACATCGTC TTGTATTAGC TCGTGAAGCA 
AGCTATGAAG AAATGAAAGA AATTAAAGAA AAAGTGGATA TTGAGATTGA AGCATTCGTC 
CATGGTGCAA TGTGTATCGC ATATTCAGGA AGATGTACGT TAAGTAACCA TATGACAGCG 
CGTGATTCTA ACCGTGGTGG TTGTTGTCAA TCTTGCCGCT GGGACTATGA TTTAGTTCAA 
ACAGTATCAC AACATAAAGA TGCAAAAGAG CTTCCTCTAT TCCAAGAAGA AGATGCTCAC 
TTCGCGATGA GTCCAAAAGA CTTAAATTTA ATTTTATCAA TTCCGAAAAT GATTGAAATT 
GGAATTGATA GCTTAAAAGT TGAAGGACGT ATGAAATCAA TCCATTACGT AGCGACTGTA 
GCGACAGTAT ACCGTAAAGT AATTGATGCA TATTGTGCGG ATCCTGATAA CTTTGAGTTT 
AAGCAAGAAT GGTTAGATGA GCTTGATAAA TGTGCAAATC GTGATACAGC TCCTGCATTC 
TTTGAAGGGG TTCCAGGACA TCAAGAGCAA ATGTTTGGAA ATCATAGTAA GAAAACAACG 
TATGATTTCG CTGGTTTAGT GTTAGATTAT AATGAAGAAA CGGGCATCGT AACGATTGAG 
CAACGTAATC ATTTCAAACC AGGACATGAA GTGGAGTTCT TTGGACCAGA AATAGAAAAC 
TTTACGCAGA CGGTGGAGAA AATTTGGGAT GAGGATGGAA ACGAATTAGA TGCAGCGAGA 
CATCCGTTGC AGATCGTGAA ATTCAAAGTG GATCAACCAG TGTATGTGAA TAATATGATG 
CGCAAAAGCA TACTTCAATA A

Protein sequence

MTVQEISRVI DGKRVIVKKP ELLIPAGNLE KLKVAIHYGA DAVYLGGQEF GLRSNAGNFT 
LEEMAEGVEF AKKYGAKIYV TTNIFAHNEN MDGLEEYLKG IEKAGVTGII VADPLIIETC 
KRVAPSVEVH LSTQQSLSNW KAAQYWKEEG LHRLVLAREA SYEEMKEIKE KVDIEIEAFV 
HGAMCIAYSG RCTLSNHMTA RDSNRGGCCQ SCRWDYDLVQ TVSQHKDAKE LPLFQEEDAH 
FAMSPKDLNL ILSIPKMIEI GIDSLKVEGR MKSIHYVATV ATVYRKVIDA YCADPDNFEF 
KQEWLDELDK CANRDTAPAF FEGVPGHQEQ MFGNHSKKTT YDFAGLVLDY NEETGIVTIE 
QRNHFKPGHE VEFFGPEIEN FTQTVEKIWD EDGNELDAAR HPLQIVKFKV DQPVYVNNMM 
RKSILQ