Gene Bcer98_1599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_1599
Symbol
ID	5343534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	1703778
End bp	1705448
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	35%
IMG OID	640839178
Product	peptidase M4 thermolysin
Protein accession	YP_001374904
Protein GI	152975387
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000990098
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA CTGTTATTAC ATTGCTTGCT GCAGGAACAA TGTTAGGTGC ACCTTTTTCA 
ACTGCGTTTG CAGAAGAACA AGCACTTCAA AAAGAAGCAA TGGATAAAAT GGAAATCCAA 
CAAAAAAATT GGAATGAGGG ACAAGGAAGT CCAGCATTTC TCTCAGGGGA ATTATCTAAT 
AAGAAGGTAG AAAGTCAAAA AGCAGTAAAA GAGTTTCTTG AAGAAAATAA AGAACTATTT 
AAAATCAATC CACAAACGGA TCTAACACTT AAAGAAGTGA AGTCTGATGA TTTAGGTATG 
AAACATTATG TTTATACAAG GTCTGTAAAT AAGGTACCTG TTGATGGTGC ACAATTCGTT 
GTTCATACAG ATAAAGAGGG TAAGGTAACA ACAGTAAATG GAGATATTCA CCCAGCTGCT 
GAAGAGAACC TAAAAGGGGA TACAAAAGCA AAAATCACAA AAGAAACAGC TCTTTCAAAT 
GCTTGGAAAC ATATTAAACT TACAAAGAAT GATACTTTAG TAAAAGTGGA TGGAAATACG 
TTAGATCAAG TAAAAGAAAA CTTAGAATCT ACAAATGAAA AAGCAGACTT AGTTGTATAT 
GAAAAAGACG GAACTTATTA TCTAGCGTTT AAAGTACAAC TGCAATTTAT CAAACCTTAC 
GGAGCGAACT GGCAGATTTA TGTGAATGCG GAAGATGGAA CAATTATAGA TTCATATAAC 
GCAGTTACAG ATGCAGATAG TCCTCGAAAA GGATATGGAT ACGGAGTATT AGGTGATCGA 
AAAGAATTGA ATACAACTTT TGACAGTGTA AAAGGGAAAT ACTATTTAAA GGATACGACA 
AAGCCTATGA ATGGAGGGTA TATTGAAACA TTTACGGTAA ATCATAGTAA TGCAGATTAC 
CCAGTTAACT ATCGTTTATG GGATGATGAT AATGCTTGGA TAAATAAAGA GCAAAGACCT 
GCGGTTGATG CTCATTATCA TGCAGGAAAA GTCTATGATT ACTATAAAAA TGTTCATAAT 
CGCAACAGTT TTGATGGAAA AGGAAAAACA ATTCGTTCTG GTGTGAATTA TGGAGTGAAT 
GTAAATAATG CATTTTGGAA TGGACAGCAA ATGGTTTATG GAGATGGCGA TGGGCGCGTA 
TTCGCTCCTC TTTCTGGTTC TCTTGATGTT GTTGCGCACG AACTAACTCA TGCTGTGACA 
CAATATTCAG CTGATCTTCG TTATGTAAAT CAATCCGGTG CATTAAATGA ATCGTTCTCT 
GACGTATTTG GATATTTTGT GGATCCTGCA AACTGGGATT TAGGAGAAGC TGTATATACA 
CCTGGTATTT CTGGAGATGC ACTTCGTAGT TTATCAAACC CTGAGAAATA TGGACAACCT 
TCTCATATGA GGGATTATCA ATATCTTCCG GCAACTGAAG AAGGAGATAA TGGTGGTGTG 
CATATTAATA GTGGTATCCC AAATAAGGCT GCATATTTGA CAATTAATGC TATTGGTAAA 
GAAAAAGCAG AAAAAATCTA TTATCGTGCG TTAACAACAT ATTTAACACC GACAAGTGAC 
TTTAAACAAG CTCGTACAGC TTTACTACAA TCTGCAGCTG ATTATGATGG TTATGGTAGT 
GCAACATATA AAGCAGTAGA AACGGCTTGG AATCAAGTAG GAGTAAAATA G

Protein sequence

MKKTVITLLA AGTMLGAPFS TAFAEEQALQ KEAMDKMEIQ QKNWNEGQGS PAFLSGELSN 
KKVESQKAVK EFLEENKELF KINPQTDLTL KEVKSDDLGM KHYVYTRSVN KVPVDGAQFV 
VHTDKEGKVT TVNGDIHPAA EENLKGDTKA KITKETALSN AWKHIKLTKN DTLVKVDGNT 
LDQVKENLES TNEKADLVVY EKDGTYYLAF KVQLQFIKPY GANWQIYVNA EDGTIIDSYN 
AVTDADSPRK GYGYGVLGDR KELNTTFDSV KGKYYLKDTT KPMNGGYIET FTVNHSNADY 
PVNYRLWDDD NAWINKEQRP AVDAHYHAGK VYDYYKNVHN RNSFDGKGKT IRSGVNYGVN 
VNNAFWNGQQ MVYGDGDGRV FAPLSGSLDV VAHELTHAVT QYSADLRYVN QSGALNESFS 
DVFGYFVDPA NWDLGEAVYT PGISGDALRS LSNPEKYGQP SHMRDYQYLP ATEEGDNGGV 
HINSGIPNKA AYLTINAIGK EKAEKIYYRA LTTYLTPTSD FKQARTALLQ SAADYDGYGS 
ATYKAVETAW NQVGVK