Gene Mpe_A2241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2241
Symbol
ID	4785373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2399719
End bp	2400831
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	70%
IMG OID	640090809
Product	prephenate dehydratase / chorismate mutase
Protein accession	YP_001021432
Protein GI	124267428
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATT CCGCTGCCTC CCCCCTCGAC CCCGCGCTGC TGGGCTTGCG CCAGCAGATC 
GACGCCGTCG ACCGCGAGTT GCTGGCCCTG CTGAACCGCC GTGCGTCGCT AGCGCAAGAA 
GTAGGCGGCA TCAAAAAGCG CGAAGGCTCG GTGGTGTTCC GCCCCGAGCG CGAGGCCCAG 
GTGATCGACG GCCTGAAAGC CTCGAATCCC GGCCCGCTGC AGGCAGACAG CGTGGCACCG 
ATCTGGCGGG AGATCATGTC GGCCTGCCGC GCCCTAGAGA CGCCGACGCG CGTGGCCTAC 
CTTGGCCCGG CCGGCACCTT CAGCGAACTC GCGGCCCTGG GCTACTTCGG CAGCTCGATC 
GTGCGCGTGC CCTGCGCCAG CATCGATGAG GTGTTCCGTA CCACGACCGC AGCCGCGGCC 
GACTTCGGCG TTGTCCCCGT CGAAAACTCG ACCGAGGGCG TGGTGGCGCG GTCGCTGGAC 
CTGCTGCTGA CGACGCCGCT GTTCCTGATC GGCGAGACCA GCCTGTTCGT GCGCCACAAC 
CTGCTGCGCC AGACCAATTC GCTGGCGGGC ATCCAGGCCG TGTGCGCGCA TCCCCAGGCG 
CTCGCGCAAT GCCACGGCTG GCTCAGCTAC CACCTGCCCG ATGTCGAGCG TCGGCCGGTT 
GCCAGCAATG CCGAGGGGGC CCGGTTGGCT TCGCTCGACC CCGGCCTCGC CGCCGTGGCG 
AGCGAACGTG CCGGCAGCGA GTTCGGACTG CACGTCGTCG CGCCGGCCAT CCAGGATGAC 
CCGCACAACC GCACCCGCTT CGTGATCGTC ACGCACCCCG ATCGGCACCC GCAGCCCAAG 
GCCTCCGGCC ACGACTGCAC CAGCCTCGTG GTGTCGGTCA ACAACCGGCC CGGTGCGGTG 
CACGACATGC TGGTGCCGCT GAAGCAGCAC GGCGTGTCGA TGACGCGCTT CGAGTCGCGC 
CCCGCCCGCA GCGCCGATCA GTGGGAGTAC TACTTCTACA TCGACCTGCA GGGCCACCCC 
GACGAGCCGG CCGTCGCCGC GGCGCTGGCC GAATTGCGCG CGGCCTGCTC CTTCTTCAAG 
CTGTTGGGCA CGTACCCGCT CGACGTCCAC TGA

Protein sequence

MADSAASPLD PALLGLRQQI DAVDRELLAL LNRRASLAQE VGGIKKREGS VVFRPEREAQ 
VIDGLKASNP GPLQADSVAP IWREIMSACR ALETPTRVAY LGPAGTFSEL AALGYFGSSI 
VRVPCASIDE VFRTTTAAAA DFGVVPVENS TEGVVARSLD LLLTTPLFLI GETSLFVRHN 
LLRQTNSLAG IQAVCAHPQA LAQCHGWLSY HLPDVERRPV ASNAEGARLA SLDPGLAAVA 
SERAGSEFGL HVVAPAIQDD PHNRTRFVIV THPDRHPQPK ASGHDCTSLV VSVNNRPGAV 
HDMLVPLKQH GVSMTRFESR PARSADQWEY YFYIDLQGHP DEPAVAAALA ELRAACSFFK 
LLGTYPLDVH