Gene YpAngola_A1953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1953
Symbol	aroA
ID	5800423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2030318
End bp	2031604
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	51%
IMG OID	641339877
Product	3-phosphoshikimate 1-carboxyvinyltransferase
Protein accession	YP_001606427
Protein GI	162418202
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0128] 5-enolpyruvylshikimate-3-phosphate synthase
TIGRFAM ID	[TIGR01356] 3-phosphoshikimate 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000000347896
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.405463
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGAAT CCCTGACCTT ACAACCCATT GCCCTAGTTA ATGGCACCGT TAATTTACCT 
GGTTCGAAGA GTGTCTCTAA CCGCGCACTG CTTCTGGCCG CGTTGGCCGA AGGGACCACT 
CAGTTGAATA ACGTGTTAGA CAGCGATGAC ATCCGCCACA TGCTCAATGC ATTACAGGCA 
TTAGGGGTGG ACTTCCGCCT TTCTGCTGAT CGCACATGCT GTGAGGTTGA TGGTCTGGGG 
GGGAAATTAG TGGCTGAACA GCCATTGTCG CTTTTCTTGG GCAATGCCGG CACAGCCATG 
CGTCCTTTGG CCGCGGTGTT ATGTTTGGGT AATAGCGATA TCGTACTGAC GGGTGAGCCT 
CGGATGAAGG AGCGGCCAAT TGGCCATTTG GTGGATGCGC TACGTCAGGG CGGTGCACAG 
ATCGATTATC TGGAACAAGA AAATTACCCG CCATTACGTT TACGTGGTGG TTTCCGAGGG 
GGGGAGTTAA CTGTTGATGG GCGTGTCTCT AGCCAGTTCC TGACTGCTTT ATTGATGACC 
GCCCCGCTGG CGGAGCAAGA TACGACTATT CGGATTATGG GTGATCTGGT TTCCAAACCT 
TATATCGATA TTACTCTGCA CTTGATGAAA GCATTTGGTA TTGACGTGGG GCATGAGAAC 
TACCAAATTT TCCACATCAA AGGGGGCCAG ACCTACCGCT CACCAGGGAC TTATTTGGTT 
GAGGGCGATG CCTCGTCGGC TTCCTACTTC TTAGCGGCTG CGGCTATTAA GGGGGGAACA 
GTGCGTGTCA CTGGTATTGG CAAGAAAAGT GTACAGGGCG ACACTAAATT TGCCGATGTG 
TTGGAAAAAA TGGGCGCGAA AGTGACGTGG GGGGATGATT ATATCGAGTG CAGTCGTGGT 
GAATTACAGG GCATTGACAT GGATATGAAC CACATTCCTG ATGCTGCAAT GACCATTGCG 
ACTACGGCAT TATTTGCCAC GGGCCCAACG ACGATCCGCA ATATCTACAA CTGGCGGGTA 
AAAGAAACTG ACCGGCTGAC GGCGATGGCA ACCGAGTTGA GAAAAGTAGG TGCTGAAGTG 
GAAGAGGGGG AAGATTACAT CCGCGTGGTT CCACCCTTGC AGCTAACTGC TGCAGATATT 
GGTACCTACG ATGACCACCG TATGGCGATG TGTTTCTCGC TGGTCGCGTT ATCAGATACC 
CCCGTGACGA TCCTTGACCC GAAATGTACC GCAAAAACCT TCCCTGATTA TTTTGAACAG 
TTTGCGCGTC TGAGCCAACT GGCCTGA

Protein sequence

MLESLTLQPI ALVNGTVNLP GSKSVSNRAL LLAALAEGTT QLNNVLDSDD IRHMLNALQA 
LGVDFRLSAD RTCCEVDGLG GKLVAEQPLS LFLGNAGTAM RPLAAVLCLG NSDIVLTGEP 
RMKERPIGHL VDALRQGGAQ IDYLEQENYP PLRLRGGFRG GELTVDGRVS SQFLTALLMT 
APLAEQDTTI RIMGDLVSKP YIDITLHLMK AFGIDVGHEN YQIFHIKGGQ TYRSPGTYLV 
EGDASSASYF LAAAAIKGGT VRVTGIGKKS VQGDTKFADV LEKMGAKVTW GDDYIECSRG 
ELQGIDMDMN HIPDAAMTIA TTALFATGPT TIRNIYNWRV KETDRLTAMA TELRKVGAEV 
EEGEDYIRVV PPLQLTAADI GTYDDHRMAM CFSLVALSDT PVTILDPKCT AKTFPDYFEQ 
FARLSQLA