Gene Mext_4444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4444
Symbol
ID	5834107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4949357
End bp	4950682
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID	641370237
Product	FolC bifunctional protein
Protein accession	YP_001641883
Protein GI	163853840
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.545059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCCT CCGACGCGTT GATGGCGCGC TTCCTCGCCC TGCATCCGCG CACGATCGAC 
CTGTCGCTCG GGCGCATTCA GCGCCTGCTC GCGGCCCTGA ATCATCCCGA GCGGCGGCTG 
CCGCCGGTGA TTCACGTCGC CGGCACCAAC GGCAAGGGCT CGACCATCGC CTTTATGCGG 
GCAATCCTGG AGGCGGGGGG CCTGGCTGCC CACGTCTACA CCTCGCCCCA CCTCGTGCGC 
TTCCATGAGC GCATCCGCTT AGGCGGCATT GGCGGCGGTC ACTACGTCGC CGAAGACCGG 
CTCGCCGATG CCTTCGCCCG CTGCGAGGCG GCCAACAAGG GCGATCCGAT CACCGTGTTC 
GAGATCACCA CCGCGGCCGC CCTGCTGCTG TTTTCCGAAT GCCCCGCCGA CGTGCTGCTG 
CTGGAAGTGG GCCTCGGCGG CCGGGTCGAT GCCACCAACG TCATCGACCA CCCGGCCTGC 
GCCGTGGTCA CCCCGATCGG GCGCGACCAT GCCGAATATC TCGGCGACAC CGTCGAGGCG 
GTGGCGATGG AGAAGGCCGG CATCTTCAAG CGCGGCTGCC CGGCGGTGAT CGCCGCCCAG 
GATTATGCCG GGGCCGACGC CGTCCTCTGC CGCCAAGCCG AGCGCGTCGG CGCGGTGCCG 
GTGCGGATCG GCAACCAGGA CTTCTCCGTA CACGAGGAGA GCGGGCGCTT CGTCTACCAG 
GACGAGATCG ACCTGTTCGA TCTGCCGCGC CCCCGCCTCG CAGGGCGCCA CCAGCTCACC 
AATGCCGGCA CTGCCATCGC GGCCCTGCGC GCGGCGGGCT TCGGCGATAT CGGCACGGTC 
GCCCTCGAAG CCGGTCTGCG CAACGTCGAT TGGCCGGGCC GGCTCCAGCG CCTCGTGCGC 
GGGGCGCTCG CCGAGCGGAT GCCCAAGGAC GCCGAGCTGT GGCTCGACGG CGGCCACAAT 
GCCGATGGCG GGCGCATCCT CGCCGCCGCC ATGGCCGATC TGGGCGAGCG CAGCGACGTG 
CCGCTGGTCC TGATCGTCGG GCTGCTCGGC ACCAAGGATG CCGAAGGCTT CCTGAAGAAC 
TTCGTCGGCC TTGCCCGCTC GCTGGTAGCG GTGCCGATCA CCGGCCAGAT GGCCGCGCGG 
CCCGCCGAGG AAGTGGCGGA AATCGCCCGT GAGGTCGGTC TCTCGGCCGA GGTCGCTCCG 
AGCGTCGAGG CGGCGTTGGC GGCCCTGTCG GACACGGTCT TCGAGCGCCC GCCGCGGGTC 
CTCATCTGCG GTTCGCTTTA TCTCGCGGGC GCCGTGCTCG AAGCCAACGG CACGATCCCG 
GTCTGA

Protein sequence

MESSDALMAR FLALHPRTID LSLGRIQRLL AALNHPERRL PPVIHVAGTN GKGSTIAFMR 
AILEAGGLAA HVYTSPHLVR FHERIRLGGI GGGHYVAEDR LADAFARCEA ANKGDPITVF 
EITTAAALLL FSECPADVLL LEVGLGGRVD ATNVIDHPAC AVVTPIGRDH AEYLGDTVEA 
VAMEKAGIFK RGCPAVIAAQ DYAGADAVLC RQAERVGAVP VRIGNQDFSV HEESGRFVYQ 
DEIDLFDLPR PRLAGRHQLT NAGTAIAALR AAGFGDIGTV ALEAGLRNVD WPGRLQRLVR 
GALAERMPKD AELWLDGGHN ADGGRILAAA MADLGERSDV PLVLIVGLLG TKDAEGFLKN 
FVGLARSLVA VPITGQMAAR PAEEVAEIAR EVGLSAEVAP SVEAALAALS DTVFERPPRV 
LICGSLYLAG AVLEANGTIP V