Gene Mchl_5157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_5157
Symbol
ID	7116195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	5524726
End bp	5526237
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	70%
IMG OID	643527850
Product	protease Do
Protein accession	YP_002423849
Protein GI	218533033
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.0527663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA CTGTCCGCCG CCGCGCCTTC GCCTCCGTCG CCGCAGCCGC CCTCGTCGCG 
GGCGGCGCCG CCGGGTTCGG CCTGACCGAG CCCATGACCC CGGCTTACGC CCAGGCCCTG 
CCCAAGACCC CGATCGAAGC GCCCGAGCAC CCGCCGGGCT CGTTTGCCAA CGTCGTCGAC 
AAGGTGAAGC CGGGCGTCGT CGCCGTGAAG GTGAAGCTCG ACAACAGCGC CGACGATGAC 
GACGACAGCG CGGGCGGTCC CAACCTGCAG CAGGTGCCGC CGCAGCTGCG CGAGTTCTTC 
AAGCGCTTCG GCCAGGGCGG TCCGGGTGGT CAGGGCGGGC GCGGCATGCC GCAGCGCGGC 
GAGCGCGGCG CGGTCGGCTC GGGCTTCATC ATCTCGGCGG ACGGCTACGT CGTCACCAAC 
AACCACGTCG TCGACAAGGC CAAGACCGTG CAGGTCACGC TCGACGACAA CCGCACCCTC 
GATGCCAAGG TGATCGGCAA GGATCCGAAG ACCGACATCG CGCTGCTCAA GATCACCGAG 
AGCGGCAGTT ACCCCTATGT CCAGTTCGGC AAGAGCGCCC CGCGCGTCGG CGATTGGGTC 
GTCGCCATCG GCAACCCGTT CGGCCTCGGC GGTACGGTGA CGGCGGGCAT CGTCTCGGCC 
CGCGGCCGTG ACATCGGCGC CGGCCCCTAC GACGACTTCC TGCAGATCGA CGCGCCGATC 
AACAAGGGCA ATTCCGGCGG CCCGACCTTC AACGTCAACG GTGAGGTCGT GGGCGTGAAC 
ACGGCGATCG CCTCACCGTC CGGCGGCTCG GTCGGCCTCG CCTTTGCGAT CCCCGCCGAG 
ACGGTGCAGA CGGTGGTCGA TCAGCTCCGC ACCGACGGCA AGGTGGTGCG CGGTTATCTC 
GGCGTGCAGG TCCAGCCGGT GACCAAGGAC ATCGCCGACG GGCTCGGCCT CGACAAGGCC 
AAGGGCGCGC TGGTCGATCA CGCCGAGAAC GGTACGCCCG CGGCCAAGGC CGGCCTGAAG 
TCGGGTGACG TGATCGAGTC GGTCAACGGC GCCCCGGTCA ACGATGCCCG CGACCTCTCG 
CGCCGCATCG CCGGCCTCAA GCCTGGCACC GAGGTGAAGC TCGCCTATCT GCGGGGCGGC 
AAGAGCGACG TCGCGACGGT CGAACTCGGC ACGCAGCCGA CCGACGCCAA GGTCGCGAGC 
CGCAGTGACA GCACGTCCGG TGGCCAGGCG CGCCTCGGCC TCAGCCTGGC CCCTGCCAGC 
GAGATCGGCC TCGGCGACGA GGGCGTGGCG GTGATGGATG TCGATCCCGA CGGTCCGGCC 
GCGGCCAAGG GCATCGCCCA GGGCGACGTG ATCCTGGATG TCGCTGGCAC CAGCGTCTCG 
AAGCCCTCCG AGGTGCAGGC GCAGATCCGC GCCGCAGAAT CGAACGGCCG CAAGGCGGTG 
CTGATGCGGG TGAAGAGCGC CAAGGGCCAG ACCCGCTTCG TCGCCGTGGC CCTCGGCAAG 
AAGGAGGGCT GA

Protein sequence

MTMTVRRRAF ASVAAAALVA GGAAGFGLTE PMTPAYAQAL PKTPIEAPEH PPGSFANVVD 
KVKPGVVAVK VKLDNSADDD DDSAGGPNLQ QVPPQLREFF KRFGQGGPGG QGGRGMPQRG 
ERGAVGSGFI ISADGYVVTN NHVVDKAKTV QVTLDDNRTL DAKVIGKDPK TDIALLKITE 
SGSYPYVQFG KSAPRVGDWV VAIGNPFGLG GTVTAGIVSA RGRDIGAGPY DDFLQIDAPI 
NKGNSGGPTF NVNGEVVGVN TAIASPSGGS VGLAFAIPAE TVQTVVDQLR TDGKVVRGYL 
GVQVQPVTKD IADGLGLDKA KGALVDHAEN GTPAAKAGLK SGDVIESVNG APVNDARDLS 
RRIAGLKPGT EVKLAYLRGG KSDVATVELG TQPTDAKVAS RSDSTSGGQA RLGLSLAPAS 
EIGLGDEGVA VMDVDPDGPA AAKGIAQGDV ILDVAGTSVS KPSEVQAQIR AAESNGRKAV 
LMRVKSAKGQ TRFVAVALGK KEG