Gene GBAA_4609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_4609
Symbol
ID	2816169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	4187226
End bp	4188506
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	38%
IMG OID	637791300
Product	U32 family peptidase
Protein accession	YP_021255
Protein GI	47529906
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.856132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGTAC AAGAAATTTC ACGAGTAATC GATGGCAAAC GCGTTATTGT GAAGAAACCT 
GAACTGTTAA TCCCTGCGGG TAACTTAGAA AAATTAAAAG TAGCTATCCA TTACGGGGCA 
GATGCTGTAT ATTTAGGTGG ACAAGAATTT GGTCTTCGTT CGAATGCAGG TAACTTTACA 
CTGGAAGAAA TGGCAGAAGG TGTGGAATTC GCAAAGAAAT ATGGAGCGAA AATATATGTA 
ACAACAAATA TCTTTGCGCA TAATGAAAAT ATGGACGGGC TAGAGGAATA TTTAAAAGGG 
ATTGAAAAAG CTGGCGTAAC GGGAATTATC GTTGCTGATC CGCTTATTAT TGAGACTTGT 
AAACGTGTAG CACCTTCTGT TGAGGTGCAT TTAAGTACAC AACAATCACT ATCCAACTGG 
AAAGCAGCAC AGTATTGGAA AGAAGAAGGT TTACATCGTC TTGTATTAGC TCGTGAAGCA 
AGCTATGAAG AAATGAAAGA AATTAAAGAA AAAGTGGATA TTGAGATTGA AGCATTCGTC 
CATGGTGCAA TGTGTATCGC ATATTCAGGA AGATGTACGT TAAGTAACCA TATGACAGCG 
CGTGATTCTA ACCGTGGTGG TTGTTGTCAA TCTTGCCGCT GGGACTATGA TTTAGTTCAA 
ACAGTATCAC AACATAAAGA TGCAAAAGAG CTTCCTCTAT TCCAAGAAGA AGATGCTCAC 
TTCGCGATGA GTCCAAAAGA CTTAAATTTA ATTTTATCAA TTCCGAAAAT GATTGAAATT 
GGAATTGATA GCTTAAAAGT TGAAGGACGT ATGAAATCAA TCCATTACGT AGCGACTGTA 
GCGACAGTAT ACCGTAAAGT AATTGATGCA TATTGTGCGG ATCCTGATAA CTTTGAGTTT 
AAGCAAGAAT GGTTAGATGA GCTTGATAAA TGTGCAAATC GTGATACAGC TCCTGCATTC 
TTTGAAGGGG TTCCAGGACA TCAAGAGCAA ATGTTTGGAA ATCATAGTAA GAAAACAACG 
TATGATTTCG CTGGTTTAGT GTTAGATTAT AATGAAGAAA CGGGCATCGT AACGATTGAG 
CAACGTAATC ATTTCAAACC AGGACATGAA GTGGAGTTCT TTGGACCAGA AATAGAAAAC 
TTTACGCAGA CGGTGGAGAA AATTTGGGAT GAGGATGGAA ACGAATTAGA TGCAGCGAGA 
CATCCGTTGC AGATCGTGAA ATTCAAAGTG GATCAACCAG TGTATGTGAA TAATATGATG 
CGCAAAAGCA TACTTCAATA A

Protein sequence

MTVQEISRVI DGKRVIVKKP ELLIPAGNLE KLKVAIHYGA DAVYLGGQEF GLRSNAGNFT 
LEEMAEGVEF AKKYGAKIYV TTNIFAHNEN MDGLEEYLKG IEKAGVTGII VADPLIIETC 
KRVAPSVEVH LSTQQSLSNW KAAQYWKEEG LHRLVLAREA SYEEMKEIKE KVDIEIEAFV 
HGAMCIAYSG RCTLSNHMTA RDSNRGGCCQ SCRWDYDLVQ TVSQHKDAKE LPLFQEEDAH 
FAMSPKDLNL ILSIPKMIEI GIDSLKVEGR MKSIHYVATV ATVYRKVIDA YCADPDNFEF 
KQEWLDELDK CANRDTAPAF FEGVPGHQEQ MFGNHSKKTT YDFAGLVLDY NEETGIVTIE 
QRNHFKPGHE VEFFGPEIEN FTQTVEKIWD EDGNELDAAR HPLQIVKFKV DQPVYVNNMM 
RKSILQ