Gene RSP_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1389
Symbol	aroC
ID	3720796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	3167682
End bp	3168782
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	71%
IMG OID	640072616
Product	chorismate synthase
Protein accession	YP_354470
Protein GI	77464966
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTACA ACACTTTCGG CCACATCTTC CGCGTCACCA CCTGGGGCGA GAGCCATGGG 
CCCGCGCTCG GCGCGACGGT GGATGGCTGC CCGCCCGGCG TCGCGATCGA GGCCGAGGCG 
ATCCAGCACT GGCTCGACCG CCGGAAGCCC GGCCAGAACC GCTTCACCAC CCAGCGGCAG 
GAGCCGGATG CGGTCAGGAT ACTGTCGGGC ACCTTCGAGG GCCGCTCGAC CGGCACGCCG 
ATCCAGCTCA TGATCGAGAA CACCGACCAG CGGTCGAAGG ACTATGGCGA GATCGCCCGG 
AGCTTCCGGC CGGGTCATGC CGACATCGCC TATCACTGGA AATACGGGCT GCGCGACTAT 
CGCGGGGGCG GGCGCTCCTC GGCGCGCGAG ACGGCGGCGC GGGTCGCGGC GGGCGGTGTC 
GCCCGGGCGG CGCTGGCGGC CTTGGTTCCC GGCCTGCGGA TCGAGGGCTA CATGGTCCAG 
ATCGGGCCGC ATGCTATCGA CCGCGCCCGG TTCGACGCGG ACGAGATCGA GCGCAACCCC 
TTCTGGTGCC CCGATCCCGA TACGGCCGCG CTCTGGGCCG ACTATCTCGA CGGACTGCGC 
AAGGCGCACG ATTCGGTGGG CGCCATCGTC GAGGTGCGGG CCTCGGGCGT GCCGGCAGGG 
CTCGGCGCGC CGATCTACGG CAAGCTCGAC AGCGACCTCG CCGCGGCCAT GATGACGATC 
AACGCGGTGA AGGGTGTCGA GATCGGCGAG GGGATGGCCG CGGCCTGCCT CACCGGCAGC 
GCCAATGCCG ACGAAATCCG CATGGGCCCC GAGGGCCCCG AGTTCCTGAC CAACCATGCG 
GGCGGCATCC TCGGCGGCAT CTCGACCGGG CAGGATGTGG TGGTGCGCTT TGCGGTGAAG 
CCCACCTCCT CGATCCTGAC CCCGCGCCGC TCGGTCACGA CCGACGGGCG CGAGGTGGAG 
GTGGTGACGA AGGGCCGCCA CGATCCCTGC GTGGGCATCC GCGCGGTGCC GGTGGGCGAG 
GCGATGATGG CCTGCGTGCT GCTCGACCAT CTGCTGCTCG ACCGCGGCCA GACCGGCGGC 
CTGCGCGGGA CGATCGGCTA G

Protein sequence

MSYNTFGHIF RVTTWGESHG PALGATVDGC PPGVAIEAEA IQHWLDRRKP GQNRFTTQRQ 
EPDAVRILSG TFEGRSTGTP IQLMIENTDQ RSKDYGEIAR SFRPGHADIA YHWKYGLRDY 
RGGGRSSARE TAARVAAGGV ARAALAALVP GLRIEGYMVQ IGPHAIDRAR FDADEIERNP 
FWCPDPDTAA LWADYLDGLR KAHDSVGAIV EVRASGVPAG LGAPIYGKLD SDLAAAMMTI 
NAVKGVEIGE GMAAACLTGS ANADEIRMGP EGPEFLTNHA GGILGGISTG QDVVVRFAVK 
PTSSILTPRR SVTTDGREVE VVTKGRHDPC VGIRAVPVGE AMMACVLLDH LLLDRGQTGG 
LRGTIG