Gene Ent638_3079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3079
Symbol	tyrA
ID	5112618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3356488
End bp	3357609
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	53%
IMG OID	640493277
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_001177794
Protein GI	146312720
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.394407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0294046
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGCAG AATTGACTGC ACTGCGCGAT CAAATTGATG AAGTCGACAA GGCGCTGCTG 
GATCTTCTGG CACGCCGCAT GTCGCTGGTC GCTGAAGTCG GTGAAGTGAA AAGCAAATAC 
GGTTTGCCGA TTTATGTGCC GGAGCGTGAA GCATCAATGC TGGCGTCCCG ACGCGATGAA 
GCGCAGTCCA TGGGGGTTTC CCCTGATTTG ATTGAAGATG TACTGCGTCG TGTGATGCGT 
GAATCCTACT CCAGCGAGAA CGACAAAGGA TTTAAAACCC TGTGTCCGTC ATTGCGCCCA 
GTGGTCATTG TGGGCGGCGG CGGCCAGATG GGCCGTCTGT TCGAAAAAAT GCTGACGCTT 
TCTGGCTATC AGGTGCGCAT TTTTGAAAAA GAGGATTGGG CACGCGCGAC AGATTTGATG 
GCTGATGCAG GCATGGTTAT CGTCAGCGTG CCGATTCATG TCACTGAGCA GATTATTGCG 
AAGCTTCCAC TATTACCGGA TGACTGCATT CTGGTTGATC TGGCGTCGGT GAAAAATGGT 
CCACTCCAGG CGATGCTGAC GGCGCACAAA GGCCCGGTAT TGGGTTTACA CCCAATGTTT 
GGCCCGGATA GCGGCAGTCT GGCGAAGCAG GTGGTCGTGT ACTGTGATGG TCGTCAGCCC 
GAAGCCTATC AGTGGTTCCT GGAACAGATT CAGGTATGGG GCGCGCGTCT ACATCGCATC 
AGTGCTGTTG AACACGATCA AAACATGGCG TTTATTCAGG CGCTGCGCCA CTTTGCGACC 
TTTGCCTATG GTTTGCATCT GGCGGAAGAA AACGTTCAGC TTGAGCAACT GTTGGCGCTT 
TCGTCACCCA TCTACCGTCT TGAACTGGCG ATGGTGGGAC GTCTGTTTGC GCAGGACCCG 
CAATTGTACG CGGATATTAT TATGTCGTCA GAGAGTAATC TGGCGCTGAT CAAACGTTAT 
TACCAGCGTT TTGGTGAGGC TATCGCGTTA CTGGAACAAG GCAACAAGCA GGCGTTTATT 
GACAGTTTCC GCAAGGTCGA GCACTGGTTC GGGGATCACG CGAAACGTTT CCAGAATGAA 
AGCCGTACCC TGTTGCGTCA GGCGAATGAT AGTCGCCAGT AG

Protein sequence

MVAELTALRD QIDEVDKALL DLLARRMSLV AEVGEVKSKY GLPIYVPERE ASMLASRRDE 
AQSMGVSPDL IEDVLRRVMR ESYSSENDKG FKTLCPSLRP VVIVGGGGQM GRLFEKMLTL 
SGYQVRIFEK EDWARATDLM ADAGMVIVSV PIHVTEQIIA KLPLLPDDCI LVDLASVKNG 
PLQAMLTAHK GPVLGLHPMF GPDSGSLAKQ VVVYCDGRQP EAYQWFLEQI QVWGARLHRI 
SAVEHDQNMA FIQALRHFAT FAYGLHLAEE NVQLEQLLAL SSPIYRLELA MVGRLFAQDP 
QLYADIIMSS ESNLALIKRY YQRFGEAIAL LEQGNKQAFI DSFRKVEHWF GDHAKRFQNE 
SRTLLRQAND SRQ