Gene Mext_4231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4231
Symbol
ID	5834907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4709178
End bp	4710533
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	73%
IMG OID	641370022
Product	peptidase M23B
Protein accession	YP_001641671
Protein GI	163853628
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTTC GGGGGAAAAT ACTGGGCTTG AGGACGCTGT CGCGCTTCGC CCTCATCGGT 
ATGATCGGCG GTGGCACCGC TGCTTGTTCG TCGGACGCCT CACGTCTCGG CGATCCCTTC 
ACCAACCCGT TCGCGTCGCT GACGGGTGAG CCCTCGGCCA CCGGCAGCCT GCCGAACGAC 
GGCGTCGAGG GTGAGATGGC GCCGGCGCCT GCGATCCGCA CGCCGCGCAT CCAGTCCCAG 
GCGCTGCCCG CTCCCGGCCC GGCCCTGTCG CCGCGCCCCG GCGCGGTCAG CGCCGCCCCG 
GCCGCGCCCC GGACCGTGAC CCGCGTCGCG ACGGCCGAGC CGATCTCCGG CGGCATGGCG 
AGCAACGTGG CCGGCCTGAA CCCCGATGCG GGCCGCGCGA TGACGCCGCG TGCCTCCGCC 
CCGGCGCCGC AGCCCAAGCT CCAGTTCGGC AAGCCCGTCG ATAAGGCGGC TGAGAAAGCG 
GCTGAGAAGC GCGCCGCCGA AGCCGCTGCC GCGAAGGCGG CCGAGGCCCG CCGCGACGCC 
GAGCGGCAGG TTGCCGCCGC CAAGGTCGCC GAGGCCAAGG CAGCCGAAGC CAAGGCCGCG 
GAGAAGGCGG CGCAGTCGAA GAAGCTTGCC GAGGCCAAGG CGGCCGAGGC GAAGAAGGCG 
GCGGAGGCGG CCAAGCATCC GCGTCCGGGC CAGAAGGGTG CCGAGAAGGT CGCCAAGGCC 
GAGCCGAAGG TCGATCCGAA GGATGCGGCC AAGGAAGCCG CGAAAGCGGA AGCCGCCCGC 
AAGGCCGAAG CCGACGCCAA GCAGGCCAAG GCGGACGCCG CCAAGAAGCT TGCCGAGGCC 
CGCGCCGCGG AAACGGCCGC GAAGGCCGCT GCCAAGGAGA GCAAGGAGGC CGCCAAGGCG 
TCCGCGAAGG AAGCGGCACC GGCTGCCCCC GTGAAGGTCG CCAGCGCCGA CGCCTCCGCC 
CCGATCCCGG CTGCCGCCCC GCAGGCCGCG GCCGAGTCGT TCCGCTGGCC GGCCAAGGGC 
CGCATCATCA ATGCCTACGG CTCGTCCGGC AACGAGGGCA TCAACATCGC CGTGCCCGAG 
GGCACGCCGG TCAAGGCCGC CGAGGACGGC ACCGTGGCCT ATGCCGGCTC CGACGTGAAG 
GGCTACGGCA AGCTGGTGCT GGTGCGGCAC AACAACGGCT ACGTCTCGGC CTACGCCCAT 
AACGGCGAGC TGGACGTGCG CCCCGGCGAG AAGGTGAAGC GCGGCCAGAC CATCGCCAAG 
TCGGGCGCCA CCGGCAACGT CACCTCGCCC CAGCTCCACT TCGAGCTGCG CAAGGGCGCG 
ACCCCGGTCG ATCCGATGCC CCATCTCGGC GGCTGA

Protein sequence

MRVRGKILGL RTLSRFALIG MIGGGTAACS SDASRLGDPF TNPFASLTGE PSATGSLPND 
GVEGEMAPAP AIRTPRIQSQ ALPAPGPALS PRPGAVSAAP AAPRTVTRVA TAEPISGGMA 
SNVAGLNPDA GRAMTPRASA PAPQPKLQFG KPVDKAAEKA AEKRAAEAAA AKAAEARRDA 
ERQVAAAKVA EAKAAEAKAA EKAAQSKKLA EAKAAEAKKA AEAAKHPRPG QKGAEKVAKA 
EPKVDPKDAA KEAAKAEAAR KAEADAKQAK ADAAKKLAEA RAAETAAKAA AKESKEAAKA 
SAKEAAPAAP VKVASADASA PIPAAAPQAA AESFRWPAKG RIINAYGSSG NEGINIAVPE 
GTPVKAAEDG TVAYAGSDVK GYGKLVLVRH NNGYVSAYAH NGELDVRPGE KVKRGQTIAK 
SGATGNVTSP QLHFELRKGA TPVDPMPHLG G