Gene Mpe_A2266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2266
Symbol
ID	4785105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2423658
End bp	2424707
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	640090834
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001021457
Protein GI	124267453
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAACC TGCAAGGCAA GAAGATCACC GTCCATGACA TGACGCTGCG CGACGGCATG 
CACCCCAAGC GCCACCTGAT GACGCTGGAT CAGATGAAGA GCATCGCCAG CGGCCTGGAC 
GCCGCCGGTG TGCCGCTGAT CGAGGTGACG CACGGCGACG GCCTGGGCGG CTCGTCGGTC 
AACTATGGTT TCCCGGCCCA CAGCGACGAG GAATACCTCG GTGCGGTGAT CCCGCTGATG 
AAGCAGGCCA AGGTGTCGGC GTTGCTGCTG CCGGGCATCG GCACCGTCGA CCACCTGCTG 
ATGGCCAAGG ACCTCGGCGT GCACACCGTG CGCGTGGCCA CCCACTGCAC CGAGGCCGAC 
GTGTCCGAGC AGCACATCTC GAAGGCGCGC TCGCTCGAGA TGGACACCGT GGGCTTCCTG 
ATGATGGCCC ACATGGCCAG CCCCGAGAAG CTGGTGAGCC AGGCGCTGCT GATGGAAGGC 
TATGGGGCCA ACTGCATCTA CGTCACCGAC TCGGCCGGCT ACATGCTGCC CGACGACGTG 
ACGGTGCGGC TGCGCGCGGT GCGCGGCGCC CTGAAGCCCG AGACTGAACT GGGTTTCCAC 
GGTCATCACA ACCTCGCGAT GGGCGTGGCC AACTCGATCG CCGCGGTCGA CGCCGGTGCG 
AACCGCATCG ACGCGGCGGC CGCCGGACTG GGCGCGGGCG CGGGCAACAC GCCGATGGAG 
GTGTTCATCG CCGTGTGCGA CCGCATGGGC ATCGCGACCG GCGTGGACGT GTTCCGGATC 
CAGGACGTGG CCGAGGACCT GGTGGTGCCG ATCATGGATC ACATCATCCG TGTCGACCGC 
GACTCGCTGA CGCTGGGCTA TGCCGGCGTG TACTCGTCCT TCCTGCTGTT CGCCAAGCGC 
GCCGAGAAGA AATACGGCGT GCCGGCCCGT GAGATCCTGG TCGAACTGGG CCGCCGCGGC 
ATGGTGGGCG GCCAGGAGGA CATGATCGAG GACACCGCGA TGACGCTGGC GCGCGAGCGC 
GCCGCCGCCG CGCACAAGGC CGCCGCCTGA

Protein sequence

MMNLQGKKIT VHDMTLRDGM HPKRHLMTLD QMKSIASGLD AAGVPLIEVT HGDGLGGSSV 
NYGFPAHSDE EYLGAVIPLM KQAKVSALLL PGIGTVDHLL MAKDLGVHTV RVATHCTEAD 
VSEQHISKAR SLEMDTVGFL MMAHMASPEK LVSQALLMEG YGANCIYVTD SAGYMLPDDV 
TVRLRAVRGA LKPETELGFH GHHNLAMGVA NSIAAVDAGA NRIDAAAAGL GAGAGNTPME 
VFIAVCDRMG IATGVDVFRI QDVAEDLVVP IMDHIIRVDR DSLTLGYAGV YSSFLLFAKR 
AEKKYGVPAR EILVELGRRG MVGGQEDMIE DTAMTLARER AAAAHKAAA