Gene Bcer98_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_1621
Symbol
ID	5346866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	1724098
End bp	1725606
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	38%
IMG OID	640839199
Product	peptidase
Protein accession	YP_001374925
Protein GI	152975408
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.379555
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGA AAGTGATAGC GCTCGCGGCG GTTATACCTC TTGTGTTAGG GACGGTATCT 
ACAGCTTCGG CAGTGGAGAA AGAACAAGTA AGCCTAGAAA AGTATTCCCC TAAAGAAAAG 
GCAATAGAAT ATTTGAAAGA AAATGCAGCG CATTATGCGT TGAAGGAAGA TCTATCAGAT 
TTACGATATA TTTCAACAAC TGAAACGCCA GTAGCCTCAT ATGTGAGATT TCAACAAGTC 
GTAAATGATG CTCCTGTATT TTCACGACAA ATAACGGTGA CAATAAATAG GGCAGGACAA 
AGTGTATTAG TAGTTTCTGA TTACCAGCCT GTTCAAAGGG TGAAAGAAAT AAAGAAAAAG 
ATGAGTGAGC AAGAAGCTGA ACAAAAGTCA AAATCATATG TATCTGGTGC TGAAAATGAA 
AGTAATTTAT GGGCACCAAC GACGAAAGAA TTTGGATATA TCATTGAAGA GGGAGTTGCT 
ATACCGGTAT ATAAAGTTGT TGTCCATTCT AATAAACCAT TTGGTGCTTG GGAAACATTG 
ATTGATGCTG GAAGTGGAAA GCTATTAAAA AAGGTGGATA TAAACCGTAA AGTAGAGGGA 
ACGGGTAAAG TATTTTTGCC AAATCCAGTC GTATCAAATG GTAGCTTAAC AGGCTTGAAA 
GATAACAATG ATAAAGATTC AGTAGAATTA AATAATCAAT TGAAAACGGT TATTTTAAAA 
GGTTTAGATG GAACGGGTTT TTTAATTGGT GATTATGTAA CAATTTCTTC TAAGGCAAAA 
ACAAAATCTA CAAATTTTCA ATTCAATTAC ACACGTTCTC ATGATAGTTT TGAAGATGTC 
ATGGCATATT ATCATATTGA TACTTTGCAA CGTTATATTC AAGGGTTGGG CTTTCAAAAT 
ATTAACAATC GCTCCATTAA AGTGAATGTA AATGGAACAA CGGCTGATAA CTCTTTTTAT 
TCTCCCTCAA CGAAAGCTTT AACATTTGGA ACAGGTGGAG TAGATGATGC AGAGGATGCC 
GGAATTATTG CACATGAATA TGGACACTCT ATCCAAGATA ATCAAGTTCC AGGGTTCGGA 
AGTTCCTTAG AAGGCGGAGC AATGGGGGAA GGGTTTGGTG ATTTCTTAGG TGCGACGTAT 
GAAGATGCTG TATCGACGAC AGAATATGGG AAAGCTTGTG TTGGAGAATG GGATGCAACA 
GCTTATTCGA GCTCTGATCC AACATGTCTT CGTCGGTTAG ATAATAATAA AGTATATCCA 
AAAGATATAC AAAATGAAGT ACATGCAGAC GGAGAAATTT GGGCGCAAGG AGAGTATGAA 
ATGGCGCAAG CCTTTGGGCG TGATGTAGCG ACAAAAATCA TTTTACAATC CCATTGGTCT 
TTGACACCAA ATGCGACATT TCATGATGGA GCACGAGCAA TTAAACAAGC GGATGCGCTT 
CTTTATGGGG GACAACATGC TGCAGAAATT GATCGAATTT GGATAGCAAG AGGAATTCGT 
ACAAATTAA

Protein sequence

MNKKVIALAA VIPLVLGTVS TASAVEKEQV SLEKYSPKEK AIEYLKENAA HYALKEDLSD 
LRYISTTETP VASYVRFQQV VNDAPVFSRQ ITVTINRAGQ SVLVVSDYQP VQRVKEIKKK 
MSEQEAEQKS KSYVSGAENE SNLWAPTTKE FGYIIEEGVA IPVYKVVVHS NKPFGAWETL 
IDAGSGKLLK KVDINRKVEG TGKVFLPNPV VSNGSLTGLK DNNDKDSVEL NNQLKTVILK 
GLDGTGFLIG DYVTISSKAK TKSTNFQFNY TRSHDSFEDV MAYYHIDTLQ RYIQGLGFQN 
INNRSIKVNV NGTTADNSFY SPSTKALTFG TGGVDDAEDA GIIAHEYGHS IQDNQVPGFG 
SSLEGGAMGE GFGDFLGATY EDAVSTTEYG KACVGEWDAT AYSSSDPTCL RRLDNNKVYP 
KDIQNEVHAD GEIWAQGEYE MAQAFGRDVA TKIILQSHWS LTPNATFHDG ARAIKQADAL 
LYGGQHAAEI DRIWIARGIR TN