Gene Mext_4840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4840
Symbol
ID	5835685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5408158
End bp	5410086
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	68%
IMG OID	641370637
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_001642279
Protein GI	163854236
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.199013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCGA ATTTCCGCAA TTTCGCCCTG TGGGTCGTCA TCTTCCTGCT GGTGCTCGCC 
CTCGTGACCC TGTTCCAGAA CCCGGGTCAC CGTGGCGGCG GCAGCGAGAT CGCCTACAGC 
CAGCTCCTGA ACGATGCCGA CGCCGGCAAG ATTCAGTCCG TCACGATCTC AGGCCAGGAC 
GTGAGCGGCA CCTATGTAGG CGGCGGCAAC TTCTCGAGCT ACGCGCCGAA CGACCCGGGC 
CTGGTCTCGA AGCTCCAGGG CAAGGGCGTG CAGATCACGG CGCGCCCGCC GTCTGACAAC 
ACGCCCTGGT TCATCCAGCT TCTCGTGAGC TGGCTGCCGA TCCTCGTGTT CATCGGCGCC 
TGGATCTTCC TCTCGCGCCA GATGCAGTCC GGCGCCGGAC GCGCCATGGG CTTCGGCAAG 
TCGAAGGCCA AGCTCCTCAA CGAAGCGCAT GGGCGCGTCT CGTTCGATGA CGTGGCCGGC 
GTCGAGGAGG CCAAGGAGGA CCTTCAGGAG ATCGTCGAGT TCCTGCGCGA TCCCCAGAAG 
TTCCAGCGCC TCGGCGGCCG CATCCCGCGC GGCGTGCTGC TCGTCGGCCC GCCCGGCACC 
GGTAAGACCC TGATCGCCCG CGCGGTCGCA GGTGAAGCCA ACGTGCCCTT CTTCACGATC 
TCCGGTTCGG ACTTCGTCGA GATGTTCGTC GGCGTCGGCG CGTCCCGCGT GCGTGACATG 
TTCGAGCAGG CGAAGAAGAA CGCGCCCTGC ATCATCTTCA TCGACGAGAT CGACGCGGTC 
GGCCGTCATC GCGGCGCCGG CCTCGGCGGC GGCAACGACG AGCGCGAGCA GACCCTCAAC 
CAGCTCCTCG TGGAGATGGA CGGGTTCGAG GCCAACGAGG GCGTCATCAT CATCGCGGCG 
ACCAACCGCC CCGACGTGCT CGATCCGGCC CTCCTGCGTC CCGGCCGGTT CGACCGCCAG 
ATCATGGTGC CGAACCCGGA CGTCACCGGC CGCGAGCGCA TCCTGCGCGT TCACGTCCGC 
AAGGTGCCGC TGGCGCCGGA TGTCGACCTC AAGACCATCG CCCGCGGTAC CCCCGGCTTC 
TCCGGCGCGG ATCTGATGAA CCTCGTCAAC GAGTCGGCGC TGCTGGCGGC GCGCCGCGGC 
AAGCGCATCG TCACGATGCA CGAGTTCGAG GACGCCAAGG ACAAGGTGAT GATGGGCGCC 
GAGCGGCGCA CCCTGGTCAT GACCGAAGAC GAGAAGCGCC TCACCGCGTA CCACGAGGGC 
GGCCATGCCA TCGTCGCGTT GAACGTGCCG GCGACCGACC CGGTTCACAA GGCGACGATC 
ATCCCCCGTG GCCGGGCGCT CGGCATGGTC ATGCAGTTGC CCGAGCGCGA CAAGCTGTCG 
ATGTCGTTCG AGCAGATGAC CTCGCGGCTG GCGATCATGA TGGGCGGCCG CATCGCCGAG 
GAGATGATCT TCGGCAAAGA CAAGGTCACC TCGGGTGCAC AGTCCGACAT CGAGCAGGCA 
ACGCGGCTGG CCAAGATGAT GGTCACCCGC TGGGGCTTCT CGCCGGAACT CGGCACCGTG 
GCCTACGGCG ACAACAACGA CGAGGTCTTC CTCGGCATGT CGATGGGCCG TCAGCAGACG 
GTCTCGGAGG CAACCGCCCA GAAGATCGAC GCCGAGGTGC GCCGTCTCGT CGAGGCCGGG 
CTGGAGGAGG CGCGCCGCAT CCTCGGGGAG CGCAAGGACG ATCTCGAGGC GCTGGCGCAG 
GGCCTGCTCG AATACGAGAC CCTCTCCGGC GACGAGATCC GCAAGCTGCT CCAGGGCGAG 
CCGCCGGTGC GTGACTCGGG CGACGTTCCG CCGACCCCGG CCCGCGGCTC GCCGGTGCCA 
TCGACCGGTC GTGGCCGCCC GCGCGGCAGC GACGGCGGCT TGGAGCCGAG CCCGCAGCCG 
CAGGGCTGA

Protein sequence

MNPNFRNFAL WVVIFLLVLA LVTLFQNPGH RGGGSEIAYS QLLNDADAGK IQSVTISGQD 
VSGTYVGGGN FSSYAPNDPG LVSKLQGKGV QITARPPSDN TPWFIQLLVS WLPILVFIGA 
WIFLSRQMQS GAGRAMGFGK SKAKLLNEAH GRVSFDDVAG VEEAKEDLQE IVEFLRDPQK 
FQRLGGRIPR GVLLVGPPGT GKTLIARAVA GEANVPFFTI SGSDFVEMFV GVGASRVRDM 
FEQAKKNAPC IIFIDEIDAV GRHRGAGLGG GNDEREQTLN QLLVEMDGFE ANEGVIIIAA 
TNRPDVLDPA LLRPGRFDRQ IMVPNPDVTG RERILRVHVR KVPLAPDVDL KTIARGTPGF 
SGADLMNLVN ESALLAARRG KRIVTMHEFE DAKDKVMMGA ERRTLVMTED EKRLTAYHEG 
GHAIVALNVP ATDPVHKATI IPRGRALGMV MQLPERDKLS MSFEQMTSRL AIMMGGRIAE 
EMIFGKDKVT SGAQSDIEQA TRLAKMMVTR WGFSPELGTV AYGDNNDEVF LGMSMGRQQT 
VSEATAQKID AEVRRLVEAG LEEARRILGE RKDDLEALAQ GLLEYETLSG DEIRKLLQGE 
PPVRDSGDVP PTPARGSPVP STGRGRPRGS DGGLEPSPQP QG