Gene Msil_3445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3445
Symbol
ID	7092468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3786853
End bp	3788733
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	60%
IMG OID	643466740
Product	Peptidase S53 propeptide
Protein accession	YP_002363701
Protein GI	217979554
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4934] Predicted protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGAT CACTGCGCAA CTATTTTGCT GCGGCAATGA TTTTTGGTGT GACGGGGGCG 
CAAGCCGGGA TTCCCTACCC GACGGCGGCG ACCCCTAAAG CGATCGACCG GGGCTTAATG 
AAAAGCCTGG CGAGCAGCAG TGAAATCTCG GTGACGGTCG CGCTGCGGCC GCGCGACCCA 
AACGGCGCGG AAGAGTTGCT CAGCGCGCTG ACGACGCCGG ATGACCCTCA GTTTCACAAA 
TTTCTCACTC CGCAACAGTT CGCCGCGAAA TTCGGCCCGA GCGCGGCGGA TGTCGCGAAG 
GTGATAGCGA CACTGAAGGG CTATGGCCTT CGGGTCGAGC AGGCGACGCC TTTCACGCTG 
CGCGCAACTG GAACTCCTGC CAAAATTGAA AGCGCCTTTC ACGTAAGCCT GCACCAGTTC 
GATGTTCCGG CGCAGGGCGG CGCGGCCGCC TACAGCTATC ACGCGCCGGC GACGCCTCCG 
ACCGCGCCGG ACGCGGTGGC CGGGCTTATC TCCGGCATCG TCGGTCTGGA TACAAAGCCG 
CATTTTCGGC CCCACGTTCA GAAGGCTCCG GCGGAGCTAA GCGCCGTCGA GGGGCAGCAG 
CAGCAAAGCG GCAACCCAAG CCTTATAAAC CCTTTGGGGT CGCTTACGGT GGCAGATTTC 
GCCCAGTATT ACGACGTGAA GCCGCTCTAC GCCGCCGGCG TCGCGGGCAA CGGCCGGACG 
CTGGGAATCA TCACTCTTGC GAATTTCACT CCGAGCGACG CTTTCCATTA TTGGACAAGG 
GTCGGGCTTG CGGTCGCGTC CAACCGAATG ACCCTCGTCA ACATCGATGG CGGCCCGGGC 
GCCCCGAGTG ACGTTTCCGG CTCCGACGAG ACCACACTGG ATGTTGAGCA GTCCGGCGGA 
TTGGCGCCGG GGGCCAGGAT GATTGTTTAT TTGGCGCCTA ACACGAACCA GGCTTTCTTC 
GACGCCTTCG CCAAGGCGGT CAACGATAAT ACGGCCGATA CGGTATCGGT CAGCTGGGGC 
GCTTGGGAGG GATTTGATCA GTCAACCGGA TTTACCAATT CGCTGCATAG CCTGCTCGTT 
CAGGCTGCCG TACAAGGGCA GAGCTTCTTC GCCGCCGCTG GCGATGATGG CGCCTACGAC 
GTCGATCGCG CGATCGGCGT CCAGGCAGGC GGCGTGACGG TCGATTATCC GGCGAGCGAT 
CCGGCCATAA CAGCGGCAGG GGGCACGACG CTTGCCGGCA AGCAGGCGTT TACCGTCAAT 
GGACGTCCCC TTGTCATCAA TGTCGCCAAG GAGCGCGTGT GGGGCTGGGA CTATCTTGAT 
CCTGTCTGCA AAAAACGAAA ATTGGACCCA ATCGATTGCG GCATCTTCTC CGTGGGCGGT 
GGCGGCGGGG TCAGCATTGT GTTTGGCATT CCTGATTATC AAACAGTGAC CAAGAGAAAA 
GGCGCTGTGC CGATTCCGGG GATAAAGACA AGCGCAAAGG GGGAGACAGT GCAAGGCGCG 
CGGCTGCCGG CTGGTTTCCA GGGGCGCAAC GTGCCGGACA TTTCAGCAAA TGCCGATCCC 
AATACCGGAT ATTCGATGGA TTATACCTCT AACATTCACG GCTTCCGCAC GACTACTTTC 
AATGGCGGCA CCAGCTTCGT CGCGCCTCAA TTTAATGGCG TCACGGCTCT GCTCTGCCAG 
AAAGCAAATA GCAGGCTCGG TTTGATCAAT AACCCTCTCT ACAGTTTAGT GAGAGCGAAT 
GCTGGCAAGA AGGCAGGCGG ACCAATAAGA TCCATCGCGA CCGGCGACAA TTGGTTTTAC 
AAAGGCGCAC AGGGTTATAG CCCGGCCGCC GGGGCCGGCG TGCTCGACGT GACGAAACTA 
GCAACCGAAC CTGGATTCTA G

Protein sequence

MNRSLRNYFA AAMIFGVTGA QAGIPYPTAA TPKAIDRGLM KSLASSSEIS VTVALRPRDP 
NGAEELLSAL TTPDDPQFHK FLTPQQFAAK FGPSAADVAK VIATLKGYGL RVEQATPFTL 
RATGTPAKIE SAFHVSLHQF DVPAQGGAAA YSYHAPATPP TAPDAVAGLI SGIVGLDTKP 
HFRPHVQKAP AELSAVEGQQ QQSGNPSLIN PLGSLTVADF AQYYDVKPLY AAGVAGNGRT 
LGIITLANFT PSDAFHYWTR VGLAVASNRM TLVNIDGGPG APSDVSGSDE TTLDVEQSGG 
LAPGARMIVY LAPNTNQAFF DAFAKAVNDN TADTVSVSWG AWEGFDQSTG FTNSLHSLLV 
QAAVQGQSFF AAAGDDGAYD VDRAIGVQAG GVTVDYPASD PAITAAGGTT LAGKQAFTVN 
GRPLVINVAK ERVWGWDYLD PVCKKRKLDP IDCGIFSVGG GGGVSIVFGI PDYQTVTKRK 
GAVPIPGIKT SAKGETVQGA RLPAGFQGRN VPDISANADP NTGYSMDYTS NIHGFRTTTF 
NGGTSFVAPQ FNGVTALLCQ KANSRLGLIN NPLYSLVRAN AGKKAGGPIR SIATGDNWFY 
KGAQGYSPAA GAGVLDVTKL ATEPGF