Gene Mpe_A1387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1387
Symbol
ID	4783980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	1496461
End bp	1498143
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	68%
IMG OID	640089953
Product	dihydroxy-acid dehydratase
Protein accession	YP_001020584
Protein GI	124266580
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.63064
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.987031
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA ACCGCCGTTC GAAGAACATC ACCGAAGGCG TGGCCCGCGC ACCCAACCGC 
TCGATGTACT ACGCGATGGG CTACCAGGAG GCCGACTTCA AGAAGCCGAT GATCGGCGTG 
GCGAACGGCC ACTCGACCAT CACGCCCTGC AACTCGGGCC TGCAGAAGCT GGCCGACGCC 
GCGGTCGAGG GCATCGAGGC GGCCGGCGGC AATGCACAGA TCTTCGGCAC CCCCACCATC 
AGCGACGGCA TGGCGATGGG CACCGAGGGC ATGAAGTACT CGCTGGTCTC GCGCGAGGTC 
ATCGCCGACT GCGTGGAAAC CTGCGTCGGC GGCCAGTGGA TGGACGGCGT GCTGGTGGTC 
GGCGGCTGCG ACAAGAACAT GCCGGGCGGC ATGATGGGCA TGCTGCGCGC CAACGTGCCC 
GCGATCTACG TCTACGGCGG CACCATCCTG CCGGGAAAGT ACAAGGGCCA GGATCTCAAC 
ATCGTCAGCG TGTTCGAGGC CGTCGGCCAG TTCACCGCGG GCAACATGAG CGAGGAAGAC 
TTCTGCCAGA TCGAGCGACG CGCGATCCCG GGCAGTGGCT CCTGCGGGGG CATGTACACC 
GCCAACACCA TGAGTTCGGC CTTCGAGGCC CTGGGCATGA GCCTGCCGTT CGCCTCCACG 
ATGGCCAATG TCGAGGACCC GATCGTCGCG CACACCAAGG AAGCGGCGCG CGTGCTGGTC 
GAGGCAGTGA AGGCCGACCT CAAGCCGCGT GACATCGTCA CACGCAAGAG CATCGAGAAC 
GCGGTCGCGG TGATCATGGC CACCGGCGGC TCGACCAATG CGGTGCTGCA CTTCCTGGCC 
ATCGCGCACG CCGCCGGCGT CGAGTGGACG ATCGACGACT TCGAGCGCGT GCGCCGCAAG 
GTGCCGGTGC TGTGCGACCT CAAACCCAGC GGCAGGTACC TGGCGATCGA CCTGCACCGC 
GCCGGCGGCA TCCCGCAGGT GATGAAGACG CTGCTCGCCG CCGGGCTGAT CCACGGCGAC 
TGCATCACCA TCACCGGAAG GACCGTGGCC GAGAACCTGG CCGACATCCC CGATGCGCCG 
CGCGCCGACC AGGACGTGAT CCGCCCGATC ACGAAGCCGA TGTACGAGCA AGGCCACCTG 
GCCATCCTGA AGGGCAACCT GTCGCCTGAG GGCGCCGTGG CCAAGATCAC CGGCCTGAAG 
AATCCCAGCA TCACTGGCCC GGCGCGCGTG TTCGACGACG AGCAGTCGGC GCTGGCCGCC 
ATCATGGCCA AGCAGATCCA GGCCGGCGAC GTGATGGTGC TGCGCTACCT GGGCCCGATG 
GGGGGCCCGG GCATGCCCGA GATGCTGGCG CCGACCGGTG CGCTGATCGG CCAAGGGCTG 
GGCGAATCGG TGGGGCTCAT CACCGACGGC CGCTTCTCCG GCGGCACCTG GGGCATGGTG 
GTCGGCCACG TGGCACCTGA GGCCGCGGCC GGCGGCACGA TCGCGCTGGT GCAGGAAGGC 
GACTCGATCA CCATCGATGC GCACACGCTG GTGCTCAACC TCAACGTGAG CGAGGCCGAG 
ATCGCAAAGC GTCGCGCCGC CTGGAAGGCA CCGGCGCCGC GCTACACACG CGGCGTGCTG 
GCCAAGTTCG CGAAGAACGC GTCAAGCGCC AGCAGCGGCG CGGTATTGGA CCGCTTCGAG 
TAG

Protein sequence

MSINRRSKNI TEGVARAPNR SMYYAMGYQE ADFKKPMIGV ANGHSTITPC NSGLQKLADA 
AVEGIEAAGG NAQIFGTPTI SDGMAMGTEG MKYSLVSREV IADCVETCVG GQWMDGVLVV 
GGCDKNMPGG MMGMLRANVP AIYVYGGTIL PGKYKGQDLN IVSVFEAVGQ FTAGNMSEED 
FCQIERRAIP GSGSCGGMYT ANTMSSAFEA LGMSLPFAST MANVEDPIVA HTKEAARVLV 
EAVKADLKPR DIVTRKSIEN AVAVIMATGG STNAVLHFLA IAHAAGVEWT IDDFERVRRK 
VPVLCDLKPS GRYLAIDLHR AGGIPQVMKT LLAAGLIHGD CITITGRTVA ENLADIPDAP 
RADQDVIRPI TKPMYEQGHL AILKGNLSPE GAVAKITGLK NPSITGPARV FDDEQSALAA 
IMAKQIQAGD VMVLRYLGPM GGPGMPEMLA PTGALIGQGL GESVGLITDG RFSGGTWGMV 
VGHVAPEAAA GGTIALVQEG DSITIDAHTL VLNLNVSEAE IAKRRAAWKA PAPRYTRGVL 
AKFAKNASSA SSGAVLDRFE