Gene Shewmr4_2833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2833
Symbol	tyrA
ID	4253404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3388014
End bp	3389153
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	49%
IMG OID	638119468
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_734961
Protein GI	113971168
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00724041
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAAA AAACCACAAC TGAATTAGAA CACCTTCGAG GTCTCATCGA TGGTGTCGAC 
CAACAATTGC TGCATTTACT ACGTAAACGC TTAGATTTAG TCGCTCAGGT GGGAACGGTA 
AAACACGCCG CAGGCCTGCC AATTTATGCG CCGCAACGCG AAGCGGCTAT GCTGGCAAAA 
CGCCGCGAAG AAGCCAAGAA CATGGGCATA GCGCCACAAC TGATTGAAGA TATTTTGCGC 
CGCTTGATGC GTGAATCCTA TCTCAACGAG AAGGATGTCG GCTTTAAGCA AGTAAAAAAC 
GATCTCGGTT CAGTCGTGAT TGTTGGTGGT AAGGGTCAGC TTGGTGGACT GTTCCAACAA 
ATGCTGACGC TCTCGGGTTA TCAGGTTAAA GTGCTTGATA AAGACGACTG GCAGCAGGCG 
GAAACCTTAT TTGCCGACGC CGGATTGGTA CTGGTGACTG TGCCTATCGC CATCACCTGC 
GACATTATCC GTGAGAAACT GACCCAATTA CCGCAGGAAT GTATCTTAGC CGACTTAACC 
TCAATCAAGA CTGAACCTAT GAATGCCATG TTGGCCGCTC ACAAGGGGCC TGTTGTCGGC 
TTTCATCCCA TGTTTGGCCC AGATGTCGGC AGTTTGGCTA AGCAGGTGGT GGTGGTGTGC 
CATGGCCGCG AAGCCGATAA ATACCAATGG TTGCTCGAGC AAATTGGAAT TTGGGGCGCA 
CGGATTGTAG AAGCTGAGCC TGAACGTCAC GACAATGCGA TGCAATTGGT ACAGGCGATG 
CGCCACTTCT CGACCTTTGT GTATGGCTTG AACCTTTGCA AAGAAGAAGC GGATATTGAA 
ACCCTGCTGC AATTTAGCTC ACCTATCTAT CGCTTAGAAC TCGCCATGGT CGGGCGCTTG 
TTTGCCCAAA GCCCGGAGCT TTATGCCGAT ATTATTTTTG CCCAGCAGGA TAGCCAGCAT 
GCGATTGGCG ATTATTTGGA TAACTATCGC GAAGCATTAG AGCTATTAAA GCGGGGCGAT 
AGGGACGCGT TTATCAGCCA GTTCCAAACG GTAGCAAAAT GGTTTGGTGA TTTTGCTCCT 
CAGTTTCAGC GTGAAAGTCG CATGATGCTG CAATCGGTCA GTGATATGAA AACGAACTGA

Protein sequence

MNEKTTTELE HLRGLIDGVD QQLLHLLRKR LDLVAQVGTV KHAAGLPIYA PQREAAMLAK 
RREEAKNMGI APQLIEDILR RLMRESYLNE KDVGFKQVKN DLGSVVIVGG KGQLGGLFQQ 
MLTLSGYQVK VLDKDDWQQA ETLFADAGLV LVTVPIAITC DIIREKLTQL PQECILADLT 
SIKTEPMNAM LAAHKGPVVG FHPMFGPDVG SLAKQVVVVC HGREADKYQW LLEQIGIWGA 
RIVEAEPERH DNAMQLVQAM RHFSTFVYGL NLCKEEADIE TLLQFSSPIY RLELAMVGRL 
FAQSPELYAD IIFAQQDSQH AIGDYLDNYR EALELLKRGD RDAFISQFQT VAKWFGDFAP 
QFQRESRMML QSVSDMKTN