Gene Mext_4472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4472
Symbol
ID	5833637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4990002
End bp	4991102
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	641370265
Product	hypothetical protein
Protein accession	YP_001641911
Protein GI	163853868
COG category	[R] General function prediction only
COG ID	[COG4111] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.859238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGGGGC CAATCCGGCA AGACCGGAAT GCGGGCCGGA ACCGCTTCCA CCGCCGAGGG 
GATGCCCACG AAGAGGGGCT GAAGGCCGAC GAACGCATGA GCACGGCCGA ACTGGGTGTG 
ACCGCCGCCG CGGCGGACAA GGGGACGCGC GCCGCCAGCG CTTCGTCGGT GGGGCTCGTG 
GCCGTCATCG TCGCGGCGAC GGACGGCGAG CCGCGCGCGC TCACCGTGCA GGTCGAGGGA 
CAAGCCGAGG GTCGCGAGAG CGCCCTGCCC GCCGGGCCTT TGGTGCCCGA GCACGCCACC 
CTGGAGCGGG GCCTTCGCGC CTGGGTCGAG CAGCAGACGC ATCAGCGCCT CGGTTATGTC 
GAGCAGCTCT ACACTTTCGG CGACCGCGAC CGGGAGGGCG GCCAGCACGA CGTGCACCTG 
CTGTCGGTGG CCTATCTCGC CCTCGTGCGC GAGCTGCGCC CGGCGGGCCT TGCGGAAGCC 
GCATGGCGCA ACTGGTACCG CTACCTGCCT TGGGAGGATT TCCGCGAGGG CCGGCCCCCG 
GCGCTCGCCG AGATCGAGCC GCGCCTGATG GCCTGGGTCG CCGCCGCCTC CGATCCGAAG 
CTCCGGCGCA TGCGCGAGGA CCGGGTCGGG CTGAGTTTCG GGATCGGCGG CGCCTGGAAC 
GAGGAGCGGG TTCTGGAGCG CTACGAATTG CTGTTCGAAG CCGGGTTGAT CCCCGAAGCC 
AACGGCCAGA ACGGCGCCGC CGTGCCCGAC GACCTCGCGA TCACCGGCCA GCCGATGGCC 
CATGACCATC GCCGGGTGCT CGCCACGGCG ATCGGCCGCC TGCGCGGCAA GATCAAGTAT 
CGCCCGGTGG TGTTCGAGTT GATGCCGCCG GCCTTCACCC TGCTTCAGCT TCAACGCACG 
GTCGAGGCGC TCTCGGGCAT CCGGCTGCAC AAGCAGAACT TCCGCCGCCT CGTGGCGCAA 
CAGGGCCTCG TCGAGGAGAC CGAGGCGCTC ACCAGCGGCA ATGCCGGGCG CCCGGCCCGG 
CTGGTGCGCT TCCGCCGGGA AGTTCTCCTG GAGCGCCCCG CCCCCGGCGT TCGGCTCACC 
CCGACGCGGC GAACGGTGTG A

Protein sequence

MPGPIRQDRN AGRNRFHRRG DAHEEGLKAD ERMSTAELGV TAAAADKGTR AASASSVGLV 
AVIVAATDGE PRALTVQVEG QAEGRESALP AGPLVPEHAT LERGLRAWVE QQTHQRLGYV 
EQLYTFGDRD REGGQHDVHL LSVAYLALVR ELRPAGLAEA AWRNWYRYLP WEDFREGRPP 
ALAEIEPRLM AWVAAASDPK LRRMREDRVG LSFGIGGAWN EERVLERYEL LFEAGLIPEA 
NGQNGAAVPD DLAITGQPMA HDHRRVLATA IGRLRGKIKY RPVVFELMPP AFTLLQLQRT 
VEALSGIRLH KQNFRRLVAQ QGLVEETEAL TSGNAGRPAR LVRFRREVLL ERPAPGVRLT 
PTRRTV