Gene Bcer98_1166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_1166
Symbol
ID	5344730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	1277669
End bp	1278769
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	36%
IMG OID	640838759
Product	peptidase M50
Protein accession	YP_001374486
Protein GI	152974969
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.59725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGA AAAATACAAA GGGATTATGG GGAATTTTGG CTGCAGTCGG AATCTTTTTA 
TTTTCTAAGC TGAAATGGGT ATTAGCAATT TTGAAATTTG CTAAATTTTC AACAGTATTT 
AGTATGTTGT TATCACTCGG AGCATATGCA GCTATATATG GTTGGAAATT TGGAGTCGCA 
CTCATTTATT TACTTTTCGT ACATGAAATG GGACATTTAT GGGCGGCGAA GCGAAAAGGT 
ATACCTACGT CACCGGCAAT TTTCATTCCA TTTATGGGTG CGTTAATTGG AATGAAGGAG 
ATGCCGAAAA ATGCAAAGGA TGAGGCGTAT CTTGCTTATA TGGGACCTTT ATTTGGTTTG 
TTATCATTTT TACCAGCTAT TCCGCTTTAT ATGCTAACGA ATGAGCCATT CTGGGCACTC 
GTGATTTTAC TGGGAAGCAT GTTGAACTTT TTTAATTTAA TTCCGGTATC GCCTTTAGAT 
GGCGGAAGAA TTATTTCGGT TGTTAGCACG AAAATTTGGA TTGGCGGTCT TGTTTTATTG 
CTTGGCTATT CCATTTTCTT TACAAGTATT ATCGGATTTT TCATTTTTGT TATAGGATGC 
ATGGAACTGT ATCGAGTAAT GAAGCGTGAT AAGCCGATTG AAGAATTAGG TTACAAAGTA 
GAAATATTAA AAACGTATCT TTCTAAATTG CAAGAAGAGT TTCTTGAAAC AGGAGCAGTG 
CATCGAACGC TTTATGTAGC TCACCATGAA ATGGGACAAT TGAGACAAAA GGCGAAAGAA 
AAGAAGCTTG AAACAGGAGA AAGCCAAAAA ATTGAAGTAT TAGAGTATAT TGTGCCTAAA 
TTTGAAGCGC TTGATTATGT GCCATATGAA GAGGAAAAAG AAGAACATAC CAATCGTATG 
AAAGAAGCGA TCGCGTTATT AGAAACAAAA GGAAATCAAT GGGAGAAGGA AAAGAAACAA 
CAAGAGGAAT ATTATAAAGT CGATGCGAAA ACAAGGTGGA TTGTATTTGG TTGTTACATT 
GGTCTACTTG TCATATTAGG CTATGCTGCT TATGAAGGAC ATGTGATTCT ACAGCAGTAT 
TTACCAGCGC GAAATGTGTA G

Protein sequence

MQKKNTKGLW GILAAVGIFL FSKLKWVLAI LKFAKFSTVF SMLLSLGAYA AIYGWKFGVA 
LIYLLFVHEM GHLWAAKRKG IPTSPAIFIP FMGALIGMKE MPKNAKDEAY LAYMGPLFGL 
LSFLPAIPLY MLTNEPFWAL VILLGSMLNF FNLIPVSPLD GGRIISVVST KIWIGGLVLL 
LGYSIFFTSI IGFFIFVIGC MELYRVMKRD KPIEELGYKV EILKTYLSKL QEEFLETGAV 
HRTLYVAHHE MGQLRQKAKE KKLETGESQK IEVLEYIVPK FEALDYVPYE EEKEEHTNRM 
KEAIALLETK GNQWEKEKKQ QEEYYKVDAK TRWIVFGCYI GLLVILGYAA YEGHVILQQY 
LPARNV