Gene MCA1418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1418
Symbol	pheA
ID	3102688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1504421
End bp	1505509
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	64%
IMG OID	637170593
Product	chorismate mutase/prephenate dehydratase
Protein accession	YP_113875
Protein GI	53804245
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01807] chorismate mutase domain of proteobacterial P-protein, clade 2

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAACG ATCCTTCTCT CGCGGAACTG CGCAAGCGCA TCGACGAACT CGACGACCGG 
GTGCTGGAAC TGCTCAACCA GCGGGCGAGG TGTGCCCAGC GGGTGGCCGA CATCAAGGTG 
GCGGCAGGCG AGACCGACTG CTTCTACCGT CCCGAACGGG AAGCGGAAAT CCTGCAGCGG 
TTGACAGCGC ACAATCCCGG CCCGCTCGGC CGAGAGGCCG TGGTCCGCTT TTTCCGCGAA 
GTGATGTCGG AATGCCTGGC CCTCGAAAAG CCGCTGAGCG TCGCCTTCCT CGGACCGGAA 
GGAACCTTCA CCCAACAGGC GGCCTACAGG CATTTCGGTC ATGCCATCCA GGCCGTCCCG 
ATGCCGGCCA TCGACGAAAT CTTCCGGGCT GTGGAGAGCG GTGCCTGTCA TTACGGTGTG 
GTGCCGGTCG AGAATTCGAC TGAAGGCGTC ATCACCCACA CCCTGGATAG CTTCGTGCGC 
TTCAGCCTGA TCATCGCCGG GGAGGTGCAG CTGCGCATCC ACCACAACCT GCTGTGCAGG 
ACACCGACCG CGCTGACCGA GCTGACCGAA GTGTTCTCCC ATCCGCAGTC GCTGGCGCAA 
TGCCGGGGCT GGCTGGACCG TTTTCTGCCG GGTGTACGCC GCACCCCCCT CGGCAGCAAC 
GCCGAAGCCG CCCGGCGGGC GGCGGAAACC GCCGGTACGG CGGCGATCGC CGGCGAAGTG 
GCGGCGGGAC TCTATGGCCT GGAGATCCTG AACCGCAACA TCGAAGACGA ACCCGACAAT 
ACCACCCGGT TCCTGGTCAT CGGCGGCCAG CCGGTGGGAC CGACTGGCCA CGACAAAACT 
TCGCTGTTAC TGTCCACCCG CAATGACCCG GGTGCGCTTT TCCGCCTCAT CGAGCCATTC 
GCGCGCCTGG GGATCAGCAT GACCAAGATC GAATCGCGGC CTTCGCGGCG CGGCATGTGG 
GACTACTTTT TTTTCATCGA CGTGGAAGGG CATCAGGCTG ATCCCACCCT GGCGCAGGCC 
CTCGCCGAGG TGCGTGAACA CTGCTGCATG ATGCGTATCC TCGGTTCCTA TCCACGCGCA 
CTGAGCTGA

Protein sequence

MANDPSLAEL RKRIDELDDR VLELLNQRAR CAQRVADIKV AAGETDCFYR PEREAEILQR 
LTAHNPGPLG REAVVRFFRE VMSECLALEK PLSVAFLGPE GTFTQQAAYR HFGHAIQAVP 
MPAIDEIFRA VESGACHYGV VPVENSTEGV ITHTLDSFVR FSLIIAGEVQ LRIHHNLLCR 
TPTALTELTE VFSHPQSLAQ CRGWLDRFLP GVRRTPLGSN AEAARRAAET AGTAAIAGEV 
AAGLYGLEIL NRNIEDEPDN TTRFLVIGGQ PVGPTGHDKT SLLLSTRNDP GALFRLIEPF 
ARLGISMTKI ESRPSRRGMW DYFFFIDVEG HQADPTLAQA LAEVREHCCM MRILGSYPRA 
LS