Gene Mext_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0020
Symbol
ID	5831663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	22475
End bp	23674
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	69%
IMG OID	641365805
Product	hypothetical protein
Protein accession	YP_001637520
Protein GI	163849477
COG category	[S] Function unknown
COG ID	[COG4320] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.117767
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGGAG CCTATGGTCC TGAGGAACGT GCTTTGGTGC TGGAGCGGCA ACGCACCCTT 
AAAATGGCCC AATCGGCCCA CGCCTATGTC CGGGGCAATA CCCTGAAGTT CTACGAGTGG 
CTCGAGGGTC TCACCCGCGG CACCCTGCCG GAGGGACCGC CGGTCTGGAT CTGCGGGGAT 
TGCCATCTCG GAAATCTCGG GCCCCTGGCC GATGCCGACG GCCGCGTCGA CATCCAGATT 
CGCGATCTCG ACCAGACCGT CATCGGCAAC CCAACGCATG ACCTCGTGCG CCTCGGGCTG 
TCGCTCGCCA GCGCCGCGCG CGGCTCCGAC CTCCCCGGTG TGGTGACGGC GCGAATGCTG 
GAACAGATGC TTCTGGGCTA CGCCGCGGGG CTGGGACAGA ACGAGACGAA CCGGGAGCCC 
TCCGAACCGG ACGCGGTGCG CTCGGTCCGC CGCCGGGCCC TCGGGCGTCA CTGGAAGCAC 
CTCGCGCGGG AGCGCCTGAA GGGCGTGGAG CCGGCGATTC CGCTCGGACG CAAGTTCTGG 
AAGCTCGACA CGGAGGAGCG CGAGGCCCTC GATGGGGTCT TTCAGGAAGA CGCGGTGCGC 
CACCTCGTGC TGGCCCTGAA CGGGCGCAGT GACGAGGCCG AGATCCGCCT GATCGACGCA 
GCCTACTGGA TGAAGGGATG CAGCTCGCTC GGCTTCCTGC GCTACGCCGC GCTCGTCGGC 
ATCACCGAGC CCGGAAACAA GCGCCGGCTC GCGCTGGTGG ACTTGAAGGA GGCGGTGGCG 
CCGGCCGCGC CGACCGCTCC CGGTGTGGCG ATGCCCTCCG AGCCGGCTGA ACGGGTGGTG 
GCCGGCGCGC GGGCCCTGTC GCCGAATCTG GGCGAACGCA TGCTGCCGGT TCGGTTGCTG 
GGCAAGTCGG CCGTGATGCG CGAACTCGCG CCACAGGACC TGAAGCTCGA CGTCGATCAA 
TTCGGCCGCG AGGAGGCAGT CCGCGCCGCG CATTACCTCG CCCATGTCGT CGGAAAGGCG 
CATGGCCGGC AGATGGACGC CGAGACCCGC GCGGCATGGC GGACCGAGAT CACGCGTGGC 
AACGACGTGG ACGAGGGGGC GCCCTCCTGG CTGTGGTCCA GCGTGGTCGA ACTCGCCGGG 
CGGCACGAGG TCGGATACCT CCAGCATTGC CGCCGCTACG TCGGCCAGGA GGCGGCCTGA

Protein sequence

MNGAYGPEER ALVLERQRTL KMAQSAHAYV RGNTLKFYEW LEGLTRGTLP EGPPVWICGD 
CHLGNLGPLA DADGRVDIQI RDLDQTVIGN PTHDLVRLGL SLASAARGSD LPGVVTARML 
EQMLLGYAAG LGQNETNREP SEPDAVRSVR RRALGRHWKH LARERLKGVE PAIPLGRKFW 
KLDTEEREAL DGVFQEDAVR HLVLALNGRS DEAEIRLIDA AYWMKGCSSL GFLRYAALVG 
ITEPGNKRRL ALVDLKEAVA PAAPTAPGVA MPSEPAERVV AGARALSPNL GERMLPVRLL 
GKSAVMRELA PQDLKLDVDQ FGREEAVRAA HYLAHVVGKA HGRQMDAETR AAWRTEITRG 
NDVDEGAPSW LWSSVVELAG RHEVGYLQHC RRYVGQEAA