Gene Sbal223_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3098
Symbol	tyrA
ID	7087876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	3676562
End bp	3677701
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	48%
IMG OID	643461982
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_002359006
Protein GI	217974255
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000040953
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.11712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAAA AAACAACGGC CGAATTAGAA CATCTTCGCG GTCTGATTGA TGGTGTCGAT 
CAGCAATTAT TGCATTTACT GCGTAAGCGC TTGGATCTCG TGGCGCAAGT GGGCACAGTG 
AAACACGGCG CCGGTTTACC GATTTATGCA CCACAGCGTG AAGCCGCCAT GCTCGCTAAA 
CGCCGCGAAG AAGCGAAAAA CATGGGGATT GCGCCGCAAT TAATTGAAGA TATTTTACGT 
CGTCTGATGC GTGAGTCTTA TCTCAATGAA AAAGATGTTG GCTTTAAGCA AGTTAAAAAA 
GATCTCGGCT CAGTGGTGAT TGTCGGCGGT AAAGGGCAAC TCGGTGGACT GTTTTCACAA 
ATGCTGACCT TATCTGGCTA CCAAGTGAAT CTGCTCGATA AAGATGATTG GCAGCAAGCA 
GATAGCCTAT TTGCCGATGC GGGCATGGTG TTAGTGACTG TGCCGATTGC GATTACTTGC 
GAGCTTATTC GCGAAAAGCT GACCCAATTA CCAGCCGACT GTATTCTGGC GGATTTGACC 
TCCATCAAGA CAGAGCCGGT TAAAGCCATG CTTGAGGCGC ATTCTGGTCC TGTCGTCGGT 
TTCCATCCTA TGTTTGGTCC CGATGTGGGC AGTTTGGCGA AACAAGTTGT GGTGGTGTGC 
CACGGTCGCT CGCCGGAGAA ATACCAATGG CTACTCGAGC AGATCGCTAT TTGGGGCGCG 
CGGATTGTCG AAGCAGAGCC CGAACGTCAC GACAGTGCAA TGCAGTTAGT GCAGGCGATG 
CGTCACTTCT CGACCTTTGT GTATGGTTTG AATCTGTGCA AGGAAGAGGC AGATATTGAT 
ACTTTACTGC AATTTAGCTC GCCGATTTAC CGTTTAGAAT TGGCTATGGT AGGGCGCTTA 
TTCGCCCAAA GCCCAGAGCT TTACGCCGAT ATTATTTTTG CCCAGCAAGA TAGCCAACAT 
GCAATCGGTG ATTATTTAGA TAACTACCGT GAAGCGTTAG AGCTGCTAAA ACGCGGCGAC 
AGGAACGAGT TTATTAAGCA GTTCCAAAGC GTCGCTAAAT GGTTTGGGGA TTTTGCCCCT 
CAATTCCAGC GCGAAAGCCG TATTATGCTG CAATCGGTCA ATGATATGAA AACCAATTAA

Protein sequence

MNEKTTAELE HLRGLIDGVD QQLLHLLRKR LDLVAQVGTV KHGAGLPIYA PQREAAMLAK 
RREEAKNMGI APQLIEDILR RLMRESYLNE KDVGFKQVKK DLGSVVIVGG KGQLGGLFSQ 
MLTLSGYQVN LLDKDDWQQA DSLFADAGMV LVTVPIAITC ELIREKLTQL PADCILADLT 
SIKTEPVKAM LEAHSGPVVG FHPMFGPDVG SLAKQVVVVC HGRSPEKYQW LLEQIAIWGA 
RIVEAEPERH DSAMQLVQAM RHFSTFVYGL NLCKEEADID TLLQFSSPIY RLELAMVGRL 
FAQSPELYAD IIFAQQDSQH AIGDYLDNYR EALELLKRGD RNEFIKQFQS VAKWFGDFAP 
QFQRESRIML QSVNDMKTN