Gene Mext_4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4238
Symbol
ID	5835089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4717352
End bp	4718407
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	71%
IMG OID	641370029
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001641678
Protein GI	163853635
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.658364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACG CCACCCCGCG CCCGCTCGCC ATCGAGACCG CGCGCGAAGC CGCCCCCGGT 
GCAGGGCCGC TGAGCCTGAC CCAGCGCCCG CGCCGCAACC GCAAGGCGGA TTGGTCGCGC 
CGCCTCGTGC GCGAGCATAG CCTCACCGTC GATGACCTGA TCTGGCCGCT CTTCGTGATC 
GAGGGCGAGA AGCGCCGCGA GCCGATCGCC TCCATGCCCG GCGTCGAGCG CCTGAGCGTG 
GACGAGATCG TGCGCGAGGC CGAGCGCGCC GCGCGGCTCG GCATCCCGGC GATCTCGTTC 
TTCCCCTACA CCGAGCCGTC CCTGCGCGAT CCGACCGGCT CCGAGGCGCT GAACCGCGAA 
AACCTCGTCT GCCGGGCGGT GCGGGCGGTG AAGCGGGCTG TTCCCGAGAT CGGCGTGATG 
ACCGATGTCG CGCTCGACCC CTATACCAGC CACGGCCATG ACGGCTTGAT CGAAGCCGGC 
GCCATCCTCA ACGACGAGAC CGTGGCGGTG CTGGTCGAGC AGAGCCTGAT CCAGGCCGAG 
GCCGGCACTG ACATTATCGC CCCCTCCGAC ATGATGGACG GGCGCGTCGG CGCGATCCGC 
ACCGGCCTCG ACCGGGCCGG CTTTCGCGAT GTTCAGATCA TGGCCTACGC CGCGAAATAC 
GCCAGCGCGT TCTACGGGCC GTTCCGCGAC GCCATCGGCA CCAGCGCGGC GCTGGTCGGC 
GACAAGCGCA CCTACCAGAT GGATCCCGGC AACGCGGCCG AGGCCCTGCG CGAGGTGGCC 
CTCGACCTTG CCGAGGGCGC CGACTCGGTG ATGGTCAAGC CCGGCCTGCC CTATCTCGAC 
ATCATCACCC GCGTGAAGAC GGAGTTCGGC GTGCCGACCT TCGCCTATCA GGTGTCGGGC 
GAGTACGCGA TGATCGAGGC CGCCGCCCGC AACGGCTGGC TCGACGGCGA CCGCGCCATG 
ACGGAGAGCC TGCTCGCCTT CAAGCGCGCG GGCGCCGACG GGGTGCTGAC CTACTACGCC 
CCCCGCGTCG CCGAGCGCCT GCGCGCGGGC GCCTGA

Protein sequence

MSDATPRPLA IETAREAAPG AGPLSLTQRP RRNRKADWSR RLVREHSLTV DDLIWPLFVI 
EGEKRREPIA SMPGVERLSV DEIVREAERA ARLGIPAISF FPYTEPSLRD PTGSEALNRE 
NLVCRAVRAV KRAVPEIGVM TDVALDPYTS HGHDGLIEAG AILNDETVAV LVEQSLIQAE 
AGTDIIAPSD MMDGRVGAIR TGLDRAGFRD VQIMAYAAKY ASAFYGPFRD AIGTSAALVG 
DKRTYQMDPG NAAEALREVA LDLAEGADSV MVKPGLPYLD IITRVKTEFG VPTFAYQVSG 
EYAMIEAAAR NGWLDGDRAM TESLLAFKRA GADGVLTYYA PRVAERLRAG A