Gene Mext_4290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4290
Symbol
ID	5834926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4775937
End bp	4776983
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641370081
Product	hypothetical protein
Protein accession	YP_001641730
Protein GI	163853687
COG category	[S] Function unknown
COG ID	[COG2326] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCT CACAATCGGC TCGTGAGCAG GTAATCTTCG GCATGGCGCG CAAGAACGGC 
AAGGACGGCA AGAGCGCCGG GAGTGAAAAA AGCCTCGAGA GCGACAAAAC GACGGAAGCA 
CAACCGCAGG CCGCGTGGCC CGACCATCCG CCTTCCTTCG CCGGCTGGGC CCGCGCGGCG 
ATCGCGGGCA CGGGCACCGC ACCGAGCCTG TCCCCGCATC TCCACCCGGT CCTGCCGCCG 
GCCGCGCCCG GCATCGTCAC GGTCGAACCC GGCCAGAGCG TCAACCTCGC CGCGATCGAT 
CCCGACGCCA GCGGCGGTCT CGAGAAGGCG GCGGCCAAGA CCGAACTCGA CGCGCAGCGC 
GTGCGCATCC GGGCGCTGCA GGAGAAGCTC TACGCCGAGC ATCGCCGCTC CCTGCTCGTG 
GTGTTCCAGG CGATCGATAC CGGCGGCAAG GACGGCACCA TCCGCAACGT GCTGGAGGGG 
GTGAACCCGC AGGGCTGCCG GGTCTGGTCG TTCAAGGTGC CGAGCACGGA GGAACTCGAT 
CAGGATTTCC TCTGGCGCTA CCACCTGCGC ACGCCCGGCC GCGGCCTGAT CGGCGTGTTC 
AACCGCAGCC ATTACGAGGA CGTGCTCGTG GTGCGGGTGA AGGGCCTCGT GCCGGAGGAG 
ACGTGGCGCG AGCGCTACGG GATCATCAAC GATTTCGAGC GGCTGCTGAC GCTCTCGGGC 
ACGGTGATCC TCAAGTTCTT CCTGCACATC TCCAAGGACG AGCAGAAGGA GCGCTTGGAG 
GCCCGCCTCG CCGATCCGGA GAAGCACTGG AAGTTCGACC CGGCCGACCT CGTGGAGCGC 
AAGAGCTGGG ACGCCTACCA GACCGCCTTC AACGACGCGC TCGCCCGCTG CTCGACGCCC 
TACGCCCCCT GGCACGTGGT GCCGGCCAAC CGCAAATGGG CCCGTAACGT CATGGTCGCC 
CGCACCATCG CCGACACGCT GGAAGCGATG GACCCGCGCT TCCCCGAGCC GCGCAAGGGG 
CTGGACGGTA TCAAGGTGCC GGATTGA

Protein sequence

MATSQSAREQ VIFGMARKNG KDGKSAGSEK SLESDKTTEA QPQAAWPDHP PSFAGWARAA 
IAGTGTAPSL SPHLHPVLPP AAPGIVTVEP GQSVNLAAID PDASGGLEKA AAKTELDAQR 
VRIRALQEKL YAEHRRSLLV VFQAIDTGGK DGTIRNVLEG VNPQGCRVWS FKVPSTEELD 
QDFLWRYHLR TPGRGLIGVF NRSHYEDVLV VRVKGLVPEE TWRERYGIIN DFERLLTLSG 
TVILKFFLHI SKDEQKERLE ARLADPEKHW KFDPADLVER KSWDAYQTAF NDALARCSTP 
YAPWHVVPAN RKWARNVMVA RTIADTLEAM DPRFPEPRKG LDGIKVPD