Gene Mfla_1686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1686
Symbol
ID	4000941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	1802990
End bp	1804057
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	637938600
Product	chorismate mutase / prephenate dehydratase
Protein accession	YP_545795
Protein GI	91776039
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATA TTCTGAAAGG TTGCCGCGAC CAGATCGATG CGATCGACGA GCAATTGCTC 
GAGCTAATCA ATGCCCGGGC TGCCTTGGCA AGGGAGATCG GTGAGCTCAA GGGCGAGGGG 
CCGATTTATC GTCCCGAGCG CGAAGCCCAG GTATTACGCC GACTATTGGA AAAGAATACC 
GGTCCGTTGT CTGCAGAGGC AGTGACCGCG ATTTTTCGTA GCGTGATGTC CAATTGCCGT 
GCGTTGGAGC GCGAGCTTTC AGTAGCTTTT CTGGGACCGC AAGGCACATA TAGTGAAGAG 
GCTGCCATCA AGCAGTTCGG TGGCCTGAAT AATCCCAAGC CCTGTATGTC GATTGATGAG 
GTGTTCCGCA TGGTCGAATC CGGCAATGCG GATTATGCCG TGGTGCCTGT GGAAAACTCC 
ACCGAGGGTG CGGTTGGCCG CACACTGGAT TTGCTCACGA CCACCAGTCT GCATATCTGT 
GGTGAGGTTG CTCTACCTAT CCATCATTGC TTGCTTCGTC GCAGGCATGC CGACGGGGAA 
ATCCGGCGTA TCTATTCCCA CGCCCAATCT TTGGGACAGT GCCATGAGTG GCTCAACCTC 
AATCTGGGCG GTGTTGAGCG CGTGAGTACT GGCAGCAATG CCCAGGCAGC GGAGCTGGCC 
GCACAGGATG CATTTGCCGT GGCCATTGCT GGCAGGCGCG CCGCTGATAT CTTCGGCCTG 
GATATCCTGG CCGAGAACAT TGAAGACGAT CCGAAGAACG TGACACGTTT CCTGGTGCTT 
GGCAAGCATG AGGCAGCCCC CTCAGGCCAG GACAAGACCT CGCTGCTGCT GGCCACGAAA 
AATGTGCCGG GCGCCATTGT AGGGCTGCTG ACGCCCCTTG CCGAGCATGG CGTGGATATG 
ACGGAGCTGG GCTCGCGGCC TTCCAAGCTT GGGATATGGG ATTATGTGTT CTTTGTTGAT 
ATCAAAGGAC ATTATCAGGA TCCCGCTGTC GCAAGGGCCC TGCATGAGCT TGAGCAACGT 
GCCTCCATGT TCAAAATCTT GGGTTCTTAT CCTGTTGCTG TTATATGA

Protein sequence

MSDILKGCRD QIDAIDEQLL ELINARAALA REIGELKGEG PIYRPEREAQ VLRRLLEKNT 
GPLSAEAVTA IFRSVMSNCR ALERELSVAF LGPQGTYSEE AAIKQFGGLN NPKPCMSIDE 
VFRMVESGNA DYAVVPVENS TEGAVGRTLD LLTTTSLHIC GEVALPIHHC LLRRRHADGE 
IRRIYSHAQS LGQCHEWLNL NLGGVERVST GSNAQAAELA AQDAFAVAIA GRRAADIFGL 
DILAENIEDD PKNVTRFLVL GKHEAAPSGQ DKTSLLLATK NVPGAIVGLL TPLAEHGVDM 
TELGSRPSKL GIWDYVFFVD IKGHYQDPAV ARALHELEQR ASMFKILGSY PVAVI