Gene SeD_A2996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2996
Symbol	tyrA
ID	6871990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2889292
End bp	2890413
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	55%
IMG OID	642786032
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_002216678
Protein GI	198246229
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGCTG AATTGACCGC GTTACGCGAT CAAATAGATG ATGTCGATAA AGCGTTGTTG 
AATTTACTGG CTAAGCGCCT GGAACTGGTT GCCAAAGTCG GCGAGGTGAA AAGCCGTTTT 
GGCCTGCCTA TTTACGTGCC GGAGCGTGAG GCCTCTATGC TGGCTTCACG ACGGGCGGAA 
GCAGAAGCGA TCGGTGTCCC GCCCGATCTC ATTGAAGATG TCCTGCGCCG GGTAATGCGT 
GAATCTTACT CCAGCGAAAA TGATAAGGGG TTCAAAACGC TTTGTCCTTC TCTGCGTCCG 
GTCGTCATTG TGGGCGGCGG CGGACAGATG GGGCGTCTGT TTGAAAAAAT GCTCACGCTG 
TCGGGCTATC AGGTCCGTAT TCTGGAACAG CAGGACTGGC CGCGCGCCAG GGACATTGTC 
GCCGATGCCG GAATGGTGAT CGTCAGCGTG CCGATTCATG TTACTGAACA GGTCATAGCG 
CAACTGCCGC CCCTGCCGTC CGACTGTATT CTGGTCGATC TGGCATCGGT GAAAAGCGAT 
CCGTTACAGG CAATGTTGGC GGCCCATGAT GGCCCCGTGT TGGGCTTGCA TCCGATGTTT 
GGCCCGGACA GCGGGAGCCT GGCGAAGCAG GTGGTGGTCT GGTGTGACGG GCGTCAACCG 
GAAGCGTATC AGTGGTTCCT TGAGCAAATC CAGGTGTGGG GCGCTCGGTT GCACCGAATT 
AGCGCTGTCG AGCACGATCA GAACATGGCT TTTATCCAGG CGTTGCGCCA TTTTGCTACC 
TTCGCTTATG GGCTGCATCT GGCGGAAGAG AACGTCCAGC TTGAGCAGCT TCTGGCGCTA 
TCATCGCCGA TTTATCGACT GGAGCTGGCG ATGGTCGGGC GTCTGTTCGC CCAGGACCCG 
CAGCTGTATG CGGACATTAT TATGTCGTCG GAGCGCAATC TGGCGCTTAT CAAGCGTTAC 
TATAAACGTT TTGGCGATGC GATCGGGTTA CTGGAACAAG GTGATAAGCA GGCTTTTATC 
GACAGTTTTC GCAAAGTTGA ACACTGGTTT GGCGATTATG CCAGACGCTT CCAGAATGAA 
AGCCGTGTGT TATTGCGTCA GGCGAATGAC AGCCGACCAT AA

Protein sequence

MVAELTALRD QIDDVDKALL NLLAKRLELV AKVGEVKSRF GLPIYVPERE ASMLASRRAE 
AEAIGVPPDL IEDVLRRVMR ESYSSENDKG FKTLCPSLRP VVIVGGGGQM GRLFEKMLTL 
SGYQVRILEQ QDWPRARDIV ADAGMVIVSV PIHVTEQVIA QLPPLPSDCI LVDLASVKSD 
PLQAMLAAHD GPVLGLHPMF GPDSGSLAKQ VVVWCDGRQP EAYQWFLEQI QVWGARLHRI 
SAVEHDQNMA FIQALRHFAT FAYGLHLAEE NVQLEQLLAL SSPIYRLELA MVGRLFAQDP 
QLYADIIMSS ERNLALIKRY YKRFGDAIGL LEQGDKQAFI DSFRKVEHWF GDYARRFQNE 
SRVLLRQAND SRP