Gene Bcer98_3094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_3094
Symbol
ID	5343800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	-
Start bp	3135572
End bp	3136852
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	38%
IMG OID	640840588
Product	peptidase U32
Protein accession	YP_001376313
Protein GI	152976796
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.585219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAATGC AAGAAATTTC ACGAGTAATT GATGGCAAGC GCGTTATTGT GAAGAAACCT 
GAATTGTTAA TCCCAGCAGG AAATTTAGAG AAATTAAAAA TAGCTATCCA TTACGGTGCA 
GATGCTGTAT ATTTAGGTGG GCAAGAATTT GGTCTTCGTT CCAATGCTGG AAACTTCACA 
TTAGAAGAGA TGGCAGAAGG CGTTGAATTT GCTAAGAAAT ATGGTGCAAA GATATATGTA 
ACAACAAATA TTTTTGCACA TAATGAGAAC ATGGAAGGGC TAGAAGAATA TTTAAGAGGC 
ATTGAAAAAG CTGGTGTAAC AGGTATTATC GTTGCAGACC CTCTTATTAT TGAAACATGT 
AAGCGGGTCG CACCTTCTGT TGAAGTACAT TTAAGTACGC AACAATCACT ATCTAACTGG 
AAAGCAGCGC AATATTGGAA AGAGGAAGGA TTACATCGCC TTGTATTAGC GCGTGAAGTT 
GGATATGAAG AAATGAAAGA AATAAAAGAA CACGTTGATA TTGAAATTGA GGCATTTGTC 
CATGGGGCAA TGTGTATTGC GTATTCTGGA AGATGTACAT TAAGTAACCA TATGACAGCA 
CGCGACTCTA ACCGCGGTGG TTGTTGCCAA TCTTGTCGCT GGGATTACGA CTTAATTCAA 
ACAGTCTCCC AACATAAAGA TGCACAAGAA TTATCGTTGT TCCAAGAAGG AGATGCTCCT 
TTCGCGATGA GTCCGAAAGA TTTAAATTTA ATTCTTTCGA TTCCAAAAAT GATTGAGATC 
GGAATTGACA GCTTAAAAGT TGAAGGACGT ATGAAATCTA TCCATTACAT TGCAACTGTA 
GCAACGGTAT ATCGTAAAGT AATCGATACG TACTGCGCAG ATCCTGATAA TTTTGAATTT 
AAACAAGAAT GGTTAGACGA ATTGGATAAA TGTGCAAATC GTGACACAGC TCCAGCTTTC 
TTTGAAGGTG TACCAGGATA TCAAGAACAA ATGTATGGAA ATCATAGTAA GAAAACAACG 
TATGATTTTG CTGGTTTAGT GTTAGATTAT AATGAAGAAA CAGGCATTGC AACAATCGAA 
CAACGTAATT ATTTTAAACC AGGCCATGAA GTGGAGTTCT TTGGACCAGA AATAGAAAAC 
TTTACACAAA CGGTGGAGAA AATTTGGGAT GAGGATGGAA ATGAATTAGA TGCAGCAAGA 
CACCCGCTGC AAATCGTGAA AATCAAAGTG GATCGACCAG TGTATGTGAA CAATATGATG 
CGCAAAAGCA TATATCAATA A

Protein sequence

MTMQEISRVI DGKRVIVKKP ELLIPAGNLE KLKIAIHYGA DAVYLGGQEF GLRSNAGNFT 
LEEMAEGVEF AKKYGAKIYV TTNIFAHNEN MEGLEEYLRG IEKAGVTGII VADPLIIETC 
KRVAPSVEVH LSTQQSLSNW KAAQYWKEEG LHRLVLAREV GYEEMKEIKE HVDIEIEAFV 
HGAMCIAYSG RCTLSNHMTA RDSNRGGCCQ SCRWDYDLIQ TVSQHKDAQE LSLFQEGDAP 
FAMSPKDLNL ILSIPKMIEI GIDSLKVEGR MKSIHYIATV ATVYRKVIDT YCADPDNFEF 
KQEWLDELDK CANRDTAPAF FEGVPGYQEQ MYGNHSKKTT YDFAGLVLDY NEETGIATIE 
QRNYFKPGHE VEFFGPEIEN FTQTVEKIWD EDGNELDAAR HPLQIVKIKV DRPVYVNNMM 
RKSIYQ