Gene VC0395_A0227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0227
Symbol	tyrA
ID	5137799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	+
Start bp	235397
End bp	236524
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	49%
IMG OID	640531687
Product	bifunctional chorismate mutase/prephenate dehydrogenase
Protein accession	YP_001216190
Protein GI	147674187
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0287] Prephenate dehydrogenase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01799] chorismate mutase domain of T-protein

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTAG AGTTGAATCA GTTACGCGAC CAAATCGATG AAGTCGATAA GCAGATGGTG 
GAGCTACTGG CGCGCCGTCT GGCATTGGTG GAGCAGGTCG GGCAAGTGAA AAGTCGATAT 
GGGTTACCGA TTTATGCTCC CGATCGTGAA GCGGCAATGC TCGCTTCACG TCGAGCGGAA 
GCGGAAAGCA AAGGTGTTCC GCCACAACTG ATTGAAGATA TTTTGCGCCG AACCATGCGT 
GAATCCTACG CCAGTGAAAA GGACTCCGGC TTTAAATGCC TCAATCCTGA GTTACGTTCC 
GTGGTGATCA TCGGTGGTAA CGGTCAGCTT GGGCGACTAT TTGGCCGTAT GTTTAAACTC 
TCTGGCTATC AAGTCAAAGT GCTGGGTAGC CAAGATTGGG ACAAAGCGGA TGAACTGCTC 
AGTGATGCTG GCTTAGTGAT AGTCACGGTA CCTATCCATT TGACGCTCGG TGTTATCGAA 
AAGCTGCGCC AGTTGCCGGA CGATTGCATT TTGTGCGATC TCACCTCAAT CAAAGCCAAG 
CCGCTTGCCG CTATGCTACA AGTGCACAAA GGTCCAGTGG TTGGGCTGCA CCCTATGTTT 
GGCCCTGATG TTCCAAGCCT GGCGAAGCAG GTGATTGTTT ACTGTGATGG TCGAGGCAAT 
GAACACTACC AATGGCTCTT GCAACAGTTT GCTATTTGGG GTGCAAGCTT GTGTCAGATT 
GATGCGACTG AACATGATCG TGGTATGACG CTTATTCAAG CTCTGCGCCA CTTCACTTCC 
TTTGCTTATG GCTTGCATCT GACCAAAGAG AACCCGAACT TGGCACAACT GCTGAAACTC 
AGTTCACCGA TTTACCGTTT AGAGCTTGCT ATGGTCGGAC GGCTATTTGG GCAAGATCCC 
CATCTATACG GCGATATTAT TCTCTCATCA CCAGAAAATA TTGAGATGAT CCAGCGTTTT 
CATCGCTGCT TAAGCGAGGC GGTTGAGTTG GTGAGCGCGG GCGATAAGGC GAGTTTTGTG 
GCTCAATTTG AACGAGTTAG CCAGTGGTTT GGTGATTATT CACAGCAGTT TATGCATGAG 
AGCCAAAACT TGCTCAAACA AGCGAATGAT GCGATCCACA GAGGTTAA

Protein sequence

MAVELNQLRD QIDEVDKQMV ELLARRLALV EQVGQVKSRY GLPIYAPDRE AAMLASRRAE 
AESKGVPPQL IEDILRRTMR ESYASEKDSG FKCLNPELRS VVIIGGNGQL GRLFGRMFKL 
SGYQVKVLGS QDWDKADELL SDAGLVIVTV PIHLTLGVIE KLRQLPDDCI LCDLTSIKAK 
PLAAMLQVHK GPVVGLHPMF GPDVPSLAKQ VIVYCDGRGN EHYQWLLQQF AIWGASLCQI 
DATEHDRGMT LIQALRHFTS FAYGLHLTKE NPNLAQLLKL SSPIYRLELA MVGRLFGQDP 
HLYGDIILSS PENIEMIQRF HRCLSEAVEL VSAGDKASFV AQFERVSQWF GDYSQQFMHE 
SQNLLKQAND AIHRG