Gene Mext_4521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4521
Symbol
ID	5834720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5050994
End bp	5052100
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	72%
IMG OID	641370315
Product	hypothetical protein
Protein accession	YP_001641960
Protein GI	163853917
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.893773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.535871
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGGG TCGTCCTGCC CGTGGGGCTG GCGCTCGGCG CGGGTGCGCT CGGCGCGCTC 
ACGCTGACAG AAGCCGGCAT CGGCCTGCGC GTGAAGGCCG GCCCCGTCCT CTCGGACCTG 
CATGATCGGT TTTCCGGGGT TGCGACGCCC GCGGCGCATC AGACGCCGAC CGCACCGAGC 
CCCCCGCCCT CGCGAGTCGC GGTGGAAGGC GGTCAGGCCG TCGTGCGGCT GACCGATGCG 
GAGCAGGCGC GGATCGGCGT CGCGACAGCC CGCCATAAGC GGATGCCCCA CCGCATCGAG 
GTCCAGGCCT TCGGCTCGGT CCTCGATCTC GCGCGGGTCA CGGAGCTCAC CAACAGCTAC 
GCCAGCGCCA GGGCGCAGTT GCAGACCGCC GAAGCCAAGG CGGAAGTCTC GCGCGCCGCC 
TATACCCGGG CGCGCAGCCT CGGCCAATAC GCGACACAGG TGCAGCTGGA GACGGCCGAG 
GGCACCTTCC GCACCGACGA GGCGGCGCTC GCTGCGGCGC AGTCGCAGGT CCGGACGCTT 
GCGGCCACCG CGCAGCAGGA ATGGGGCACG GTGATCGGGC GGGCCATCAT CGAGCGTTCG 
CCCGCCATCA CCCGGCTGAT CGAGCGCACC GACTTCCTGG TGCAGGTCAC GCTGCCGCCC 
GGCGAGACGC TGCGGGCGCC GCCCGGCACG GCCCATGCCG AGGTGCCGCC GCAGAGCGAG 
CGCGTCGCCT TGCGTTACGT CTCGCCCGCG ACCCGGACCG ATCAGCGCAT CCAGGGCGTC 
AGCTACTTCT ACACCGTGGC CGGCAATAGC GGGCTCCTGC CGGGCATGAG CACGCTCGCC 
TTCCTGACCT CGGAGCGCGA GACGACGGGC ATCGCCGTGC CGGAAAGCGC CGTGGTGCAC 
TGGCAGGGCG GCGCCTGGAT CTACCGGAGC GTCGGCGACG ACGCCTTTGC GCGCCATCCC 
CTCCGGGCCG ACGCGCCGAT CTCGGCCGAC GCCTACGTCG TGGACGATCT CGGCGCGGAG 
GCGGAGATCG TCGTGACCGG GCCGCAGGCC GTCCTCTCCG AGGAGCTGAA GGGGCAGATC 
CAGTCCTCGG ATGCGGACGA CGATTGA

Protein sequence

MRRVVLPVGL ALGAGALGAL TLTEAGIGLR VKAGPVLSDL HDRFSGVATP AAHQTPTAPS 
PPPSRVAVEG GQAVVRLTDA EQARIGVATA RHKRMPHRIE VQAFGSVLDL ARVTELTNSY 
ASARAQLQTA EAKAEVSRAA YTRARSLGQY ATQVQLETAE GTFRTDEAAL AAAQSQVRTL 
AATAQQEWGT VIGRAIIERS PAITRLIERT DFLVQVTLPP GETLRAPPGT AHAEVPPQSE 
RVALRYVSPA TRTDQRIQGV SYFYTVAGNS GLLPGMSTLA FLTSERETTG IAVPESAVVH 
WQGGAWIYRS VGDDAFARHP LRADAPISAD AYVVDDLGAE AEIVVTGPQA VLSEELKGQI 
QSSDADDD