Gene PA14_42760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PA14_42760
Symbol	aroC
ID	4381409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pseudomonas aeruginosa UCBPP-PA14
Kingdom	Bacteria
Replicon accession	NC_008463
Strand	-
Start bp	3802844
End bp	3803935
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	68%
IMG OID	639326000
Product	chorismate synthase
Protein accession	YP_791565
Protein GI	116049630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGCA ACACCTACGG CAAGCTCTTC ACCGTCACCA CCGCAGGCGA AAGCCACGGC 
CCGGCGCTGG TCGCCATCGT CGATGGGTGC CCCCCGGGGC TGGAACTGTC CGCCCGGGAC 
CTGCAACGCG ACCTCGACCG GCGCAAGCCC GGCACCAGCC GGCACACCAC CCAGCGCCAG 
GAAGCCGACG AGGTGGAGAT TCTTTCCGGG GTGTTCGAGG GCAAGACCAC CGGCACGCCG 
ATCGGCCTGC TGATCCGCAA CACCGACCAG AAGTCCAAGG ACTACTCGGC GATCAAGGAC 
CTGTTCCGCC CGGCCCACGC CGACTACACC TACCACCACA AGTACGGCGT GCGCGACTAC 
CGCGGCGGCG GCCGTTCTTC GGCGCGCGAG ACCGCCATGC GCGTGGCCGC CGGGGCTATT 
GCCAAGAAAT ACCTGGCGGG CCTGGGCATC CAGGTGCGCG GCTACATGAG CCAGCTCGGG 
CCGATCGAGA TTCCGTTCAG GAGCTGGGAC AGCGTCGAGC AGAATGCCTT CTTCAGCCCC 
GACCCGGACA AGGTGCCGGA GCTGGAGGCC TACATGGACC AATTGCGCCG CGACCAGGAT 
TCGGTCGGGG CGAAGATCAC CGTGGTTGCC GAAGGCGTGC CGCCGGGCCT GGGCGAGCCG 
ATCTTCGACC GCCTGGACGC CGAACTGGCG CATGCGCTGA TGAGCATCAA CGCGGTGAAG 
GGCGTGGAGA TCGGCGCCGG CTTCGCCAGC ATCGCCCAGC GCGGCACCGA GCACCGCGAC 
GAACTGACCC CGCAAGGCTT CCTGTCGAAC AATGCCGGCG GCATCCTCGG CGGGATCTCC 
TCTGGCCAGC CGATCGTCGC CCACCTGGCG CTGAAGCCGA CCTCCAGCAT CACCACTCCC 
GGGCGCTCGA TCGATACCGC CGGCGAGCCG GTGGACATGA TCACCAAGGG CCGTCACGAC 
CCGTGCGTCG GCATCCGCGC CACGCCGATC GCCGAGGCGA TGATGGCCAT CGTCCTGCTC 
GACCAGTTGC TGCGCCAGCG TGGGCAGAAC GCCGACGTGC GCGTCGACAC GCCGGTCCTG 
CCGCAGCTGT GA

Protein sequence

MSGNTYGKLF TVTTAGESHG PALVAIVDGC PPGLELSARD LQRDLDRRKP GTSRHTTQRQ 
EADEVEILSG VFEGKTTGTP IGLLIRNTDQ KSKDYSAIKD LFRPAHADYT YHHKYGVRDY 
RGGGRSSARE TAMRVAAGAI AKKYLAGLGI QVRGYMSQLG PIEIPFRSWD SVEQNAFFSP 
DPDKVPELEA YMDQLRRDQD SVGAKITVVA EGVPPGLGEP IFDRLDAELA HALMSINAVK 
GVEIGAGFAS IAQRGTEHRD ELTPQGFLSN NAGGILGGIS SGQPIVAHLA LKPTSSITTP 
GRSIDTAGEP VDMITKGRHD PCVGIRATPI AEAMMAIVLL DQLLRQRGQN ADVRVDTPVL 
PQL