Gene M446_6607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_6607
Symbol
ID	6135887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	7270723
End bp	7272798
Gene Length	2076 bp
Protein Length	691 aa
Translation table	11
GC content	75%
IMG OID	641646698
Product	peptidase S9 prolyl oligopeptidase
Protein accession	YP_001773297
Protein GI	170744642
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1505] Serine proteases of the peptidase family S9A
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0858273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCCA CGCCCGATCC CCGCCCGACC CTCGCGGCGC CCGACGACGA TCCCTACCTG 
TGGCTGGAGG AGATCGACGG GGCGCGGGCC CTGGCCTGGG TCGAGGCGCA GAACGCCGCC 
ACCCTCGAGG CGCTCGCGGA CGGGCGCCTC GCCGCCGACC GGGACGGGCT CAAGGCCGCC 
CTCGACCGGC CCGACAAGAT CCCGGGCGTC ACGCGGCGGG GCGGGCTGCT CTACAATCAC 
TGGCAGGATG CCGACCATCC CCGCGGCCTG TGGCGGCGCA CCACCCTCGC CTCCTACCGG 
GCGCCGGACA CGGAGTGGGA GCTCCTCCTC GACCTCGACG CCCTCGCCCG CGAGGAGGGC 
GAGGACTGGG TCTGGGCCGG GGCCATCAGC CTGCCGGGAT CGCACGACCG GGCGCTGCTC 
AAGCTCTCCC GCGGCGGCGG CGACGCCGCC GTGGTGCGCG AATTCGACCT GCCCTCCCGC 
GCCTTCGTGC CGGACGGCTT CGTGCTGCCG GAGGGCAAGA GCTATCCGGC CTGGCTCGAC 
CGCGACACGG TGCTGCTGGC GAGTCCCCTC GGTGAGGGCA TGGCGACCCT GTCGGGCTAC 
GCCCGCACCG TCCGGCTCTG GACCCGCGGC GGCGATCCCC TGGCGGCGCC GGTCATCTTC 
GAGGCGCCGC CCGAGAGCAT GGCGGTCCAT GCCAGCCACG ACCGGGAGGC GGCGCCCGAG 
CGCGTCGTCT TCGTCGAGCG CACCGGCTTC TTCGACGGCG TGACCCATCT CGGCGACCGG 
TCCGGCGCCA AGATCCGCCT CGACCTGCCG ACCGATGCCG ACGCGCAGTG GAGCCGGGGC 
GTCCTGGTCG TGCGGACCCG CTCGCCCTGG ACCCTCGGCG GCACGACCCA CCCGCCCGAC 
ACCCTGCTCG GCATCGGCCT CGACGCCTTC CTGGCCGGCG CGCGCGATCT CCGCGTGCTG 
TTCGAGCCCG GTCCCCGGCG GGCGCTGCAG GGCTTCTTCT GGTCCGGCCC CTTCCTCGTC 
CTGTCGGTGC TCGACGACCT GCGGGCGCGG TTCCCGGTCT TCCGGCCGGA CGAGGACTGG 
GCGCGCGGCG AGGTCGGGGG CCTGCCGGAA CTCGGGATGG TCGGCGTCTG GTCCCTCGAC 
GCCGAGGAGG ACGAGGCGAA CGGCGACCTC CTCGCCGCCG CCAACGACCC GGTCACGCCG 
GCGACCCTGA TGCTGACCCG GCCCGGCCCC GGCGGGCCGA CGATCCTGCG GCAGGCGCCC 
GCCACCTTCT CGGCCGAGGG GCTGGTGGTG ACCCGGCACG AGGCGGTCTC GGTCGACGGC 
GAGCGCATTC CCTACGTGCA GGCGGGGCCG CCGGGCGAGA CCGGCGAGGC GCCGGTCCAC 
CTCTCGGGCT ACGGCGGCTT CCAGGTCTCG AACCTCGCCG GCTACTCGGC GGTGCTCGGC 
CGGCTCTGGC TGGAGAAGGG CGGCACCCGC GTGGTGGCCA ACATCCGCGG CGGCGGCGAG 
TTCGGCACGA CCTGGCACGA GGCCGGCCGC CGCGAGGGCA AGGCGCGCTC GCACGACGAT 
TTCGCCGCGG TCGCGGCCGA CCTCGTGCGC CGCGGCGTGA CCCGGCCCGA CCGGATCGCC 
GCCGAGGGCG GCTCGAATGG CGGCCTGCTC GTCGCCAACA TGCTGACCCG CTACCCGGAG 
CGGTTCGGGG CGCTGCTCTG CACGATCCCC CTCATCGACA TGCGCCGCTA CCACCGGCTG 
CTCGCCGGGG CGAGCTGGGT GGCCGAGTAC GGCGACCCGG ACGCGGCGGA GGATTGGGCC 
TTCCTCCGGC ACATCTCCGC CTACCACGTC GCCGCGCCCG GGCGGCCCTA CCCGCCGATC 
CTGATCGCCA CGACGCGGCG GGACGACCGC GTCCATCCGG GCCACGCCCG CAAGATGGCG 
GCGAAGCTGC AGGCCATGGG CTATCCGGCC CGCTTCTACG AGCCGGAGGC GGGCGGGCAT 
TCCTACGGCA AGAACAGCCA GGAGACCGCG ACCTTCGCGG CGCTCGGGGC GGCCTTCCTG 
CGGCGCGCCA TCGGCTGGGA GCCGGAGGTG GCCTGA

Protein sequence

MTPTPDPRPT LAAPDDDPYL WLEEIDGARA LAWVEAQNAA TLEALADGRL AADRDGLKAA 
LDRPDKIPGV TRRGGLLYNH WQDADHPRGL WRRTTLASYR APDTEWELLL DLDALAREEG 
EDWVWAGAIS LPGSHDRALL KLSRGGGDAA VVREFDLPSR AFVPDGFVLP EGKSYPAWLD 
RDTVLLASPL GEGMATLSGY ARTVRLWTRG GDPLAAPVIF EAPPESMAVH ASHDREAAPE 
RVVFVERTGF FDGVTHLGDR SGAKIRLDLP TDADAQWSRG VLVVRTRSPW TLGGTTHPPD 
TLLGIGLDAF LAGARDLRVL FEPGPRRALQ GFFWSGPFLV LSVLDDLRAR FPVFRPDEDW 
ARGEVGGLPE LGMVGVWSLD AEEDEANGDL LAAANDPVTP ATLMLTRPGP GGPTILRQAP 
ATFSAEGLVV TRHEAVSVDG ERIPYVQAGP PGETGEAPVH LSGYGGFQVS NLAGYSAVLG 
RLWLEKGGTR VVANIRGGGE FGTTWHEAGR REGKARSHDD FAAVAADLVR RGVTRPDRIA 
AEGGSNGGLL VANMLTRYPE RFGALLCTIP LIDMRRYHRL LAGASWVAEY GDPDAAEDWA 
FLRHISAYHV AAPGRPYPPI LIATTRRDDR VHPGHARKMA AKLQAMGYPA RFYEPEAGGH 
SYGKNSQETA TFAALGAAFL RRAIGWEPEV A