Gene SNSL254_A1011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1011
Symbol	aroA
ID	6483471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1023113
End bp	1024396
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	54%
IMG OID	642736417
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_002040176
Protein GI	194446151
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCCC TGACGTTACA ACCCATCGCG CGGGTCGATG GCGCCATTAA TTTACCTGGC 
TCCAAAAGTG TTTCAAACCG TGCTTTGCTC CTGGCGGCTT TAGCTTGTGG TAAAACCGTT 
CTGACGAATC TGCTGGATAG CGATGACGTC CGCCATATGC TCAATGCCTT GAGCGCGTTG 
GGGATCAATT ACACCCTTTC TGCCGATCGC ACCCGCTGTG ATATCACGGG TAATGGCGGC 
GCATTACGTG CGCCAGGCGC TCTGGAACTG TTTCTCGGTA ATGCCGGAAC CGCGATGCGT 
CCGTTAGCGG CAGCGCTATG TCTGGGGCAA AATGAGATAG TGTTAACCGG CGAACCGCGT 
ATGAAAGAGC GTCCGATAGG CCATCTGGTC GATTCGCTGC GTCAGGGCGG GGCGAATATT 
GATTACCTGG AGCAGGAAAA CTATCCGCCC CTGCGTCTGC GCGGCGGTTT TACCGGCGGC 
GACATTGAGG TTGATGGTAG CGTTTCCAGC CAGTTCCTGA CCGCTCTGCT GATGACGGCG 
CCGCTGGCCC CTGAAGACAC AATTATTCGC GTTAAAGGCG AACTGGTATC AAAACCTTAC 
ATCGATATCA CGCTAAATTT AATGAAAACC TTTGGCGTGG AGATAGCGAA CCACCACTAC 
CAACAATTTG TCGTGAAGGG AGGTCAACAG TATCACTCTC CAGGTCGCTA TCTGGTCGAG 
GGCGATGCCT CGTCAGCGTC CTATTTTCTC GCCGCCGGGG CGATAAAAGG CGGCACGGTA 
AAAGTGACCG GAATTGGCCG CAAAAGTATG CAGGGCGATA TTCGTTTTGC CGATGTGCTG 
GAGAAAATGG GCGCGACCAT TACCTGGGGC GATGATTTTA TTGCCTGCAC GCGCGGTGAA 
TTGCACGCCA TAGATATGGA TATGAACCAT ATTCCGGATG CGGCGATGAC GATTGCCACC 
ACGGCGCTGT TTGCGAAAGG AACCACGACG TTGCGCAATA TTTATAACTG GCGAGTGAAA 
GAAACCGATC GCCTGTTCGC GATGGCGACC GAGCTACGTA AAGTGGGCGC TGAAGTCGAA 
GAAGGGCACG ACTATATTCG TATCACGCCG CCGGCGAAGC TCCAACACGC GGATATTGGC 
ACGTACAACG ACCACCGTAT GGCGATGTGC TTCTCACTGG TCGCACTGTC CGATACGCCA 
GTTACGATCC TGGACCCTAA ATGTACCGCA AAAACGTTCC CTGATTATTT CGAACAACTG 
GCGCGAATGA GTACGCCTGC CTAA

Protein sequence

MESLTLQPIA RVDGAINLPG SKSVSNRALL LAALACGKTV LTNLLDSDDV RHMLNALSAL 
GINYTLSADR TRCDITGNGG ALRAPGALEL FLGNAGTAMR PLAAALCLGQ NEIVLTGEPR 
MKERPIGHLV DSLRQGGANI DYLEQENYPP LRLRGGFTGG DIEVDGSVSS QFLTALLMTA 
PLAPEDTIIR VKGELVSKPY IDITLNLMKT FGVEIANHHY QQFVVKGGQQ YHSPGRYLVE 
GDASSASYFL AAGAIKGGTV KVTGIGRKSM QGDIRFADVL EKMGATITWG DDFIACTRGE 
LHAIDMDMNH IPDAAMTIAT TALFAKGTTT LRNIYNWRVK ETDRLFAMAT ELRKVGAEVE 
EGHDYIRITP PAKLQHADIG TYNDHRMAMC FSLVALSDTP VTILDPKCTA KTFPDYFEQL 
ARMSTPA