Gene Mext_4804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4804
Symbol
ID	5835239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5366803
End bp	5368074
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	67%
IMG OID	641370601
Product	5-aminolevulinate synthase
Protein accession	YP_001642243
Protein GI	163854200
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase [TIGR01821] 5-aminolevulinic acid synthase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.577654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.145905
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGCGGA CGCAAGATCC ACCCACCGGC ATCATCTTCT TCGGGGAGGA CGGCATGGAT 
TACGAAGCGT TCTTCGACAA TGCGATCACC GGCCTCCACC GGGAGGGGCG CTACCGCGTC 
TTCACCGATC TGGAGCGACA GGCGGGGCGG TTCCCCTACG CGACGCATCA CAGCCCCGGC 
GGCGCGCGTG AGGTCACCGT CTGGTGCTCC AACGACTATC TCGGCATGGG CCAGCATCCG 
TCGGTGCTGC AAGCGATGCA CGAGGCGATC GACCGATGTG GAGCCGGCGC GGGCGGCACC 
CGAAACATCT CCGGCACCAA CCATTATCAC GTGCTCTTGG AGCAGGAACT CGCCGACCTC 
CACGGAAAGG AAGCGGCGCT GATCTTCTCC TCCGGCTACG TCTCGAACTG GGCGGCGCTC 
GGCACACTCG CCTCGAAGCT TCCGGGCTGC GTCGTCTTCT CCGACGAGGG CAACCATGCC 
TCGATGATCG AGGGCATCCG TTCGAGCCGG GCCGAGCGCC AGATCTTCCG CCACAACGAT 
CCGGAGGATC TGGACCGCAA GCTCGGGCTG ATCGAGCCCG GCCGGGCCAA GCTCGTCGCC 
TTCGAGTCGG TCTATTCGAT GGATGGCGAC ATCGCCCCGA TCGACGAGAT CTGCGACGTG 
GCCGAGGCGC ACGGGGCGCT CACCTATCTC GACGAGGTGC ACGCGGTCGG CCTCTACGGC 
GCGCGGGGCG GCGGCATCTC GGAGCGGATG GAACTCGCCC ACCGGCTCGA CGTGATCGAG 
GGAACGCTCG GCAAAGCGTT CGCCGTCCAT GGCGGCTACA TCACCGGCTC GACGCAGCTC 
TGCGACTTCG TGCGCAGCTT CGCCTCGGGC TTCATCTTCA CGACCTCGCT GCCGCCGGCG 
GTCGCGGCCG GCGCGGCGGC GAGCATCCGC CACCTCAAGG CGAGCCGTGT CGAGCGGGCG 
CGGCATCAGG AGCGGGTGGC GCGGGTCCGG CAAGCGCTGG ATGCGGCGGG CATCCCGACT 
TTGGCCAACC GCAGCCACAT CGTGCCGGTG ATGGTTTGCG ATCCCGTACT GTGCAAGGCG 
ATCAGCGATA CCCTGCTCGA CGAGTTCGGC ATCTACGTGC AGCCGATCAA CTACCCGACC 
GTGCCGCGCG GGACGGAGCG CCTACGCATC ACGCCCTCGC CGCTGCATTC CAACGCCGAC 
ATCGACCACC TCGTGGACGC ACTGAGCACG ATCTGGCGGC GGATCGGGCT GAGCAAGGCG 
GCGGCGGAGT AG

Protein sequence

MRRTQDPPTG IIFFGEDGMD YEAFFDNAIT GLHREGRYRV FTDLERQAGR FPYATHHSPG 
GAREVTVWCS NDYLGMGQHP SVLQAMHEAI DRCGAGAGGT RNISGTNHYH VLLEQELADL 
HGKEAALIFS SGYVSNWAAL GTLASKLPGC VVFSDEGNHA SMIEGIRSSR AERQIFRHND 
PEDLDRKLGL IEPGRAKLVA FESVYSMDGD IAPIDEICDV AEAHGALTYL DEVHAVGLYG 
ARGGGISERM ELAHRLDVIE GTLGKAFAVH GGYITGSTQL CDFVRSFASG FIFTTSLPPA 
VAAGAAASIR HLKASRVERA RHQERVARVR QALDAAGIPT LANRSHIVPV MVCDPVLCKA 
ISDTLLDEFG IYVQPINYPT VPRGTERLRI TPSPLHSNAD IDHLVDALST IWRRIGLSKA 
AAE