Gene RSc1566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc1566
Symbol	aroC
ID	1220397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	+
Start bp	1681674
End bp	1682774
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	69%
IMG OID	637237951
Product	chorismate synthase
Protein accession	NP_519687
Protein GI	17546285
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCA ATACCCTGGG CCTGCTGTTT TCCGTCACCA CCTTCGGCGA GTCGCACGGC 
CCGGCCATCG GTGCCGTCAT CGACGGCTGC CCGCCGGGCA TGGCGCTGTC GGCCGAGGAC 
ATCCAGCCCG ATCTCGACCG CCGCAAGCCC GGCACCTCGC GCCACGTCAC GCAGCGCAAG 
GAAGAAGACC TTGTCGAGAT CCTGTCCGGC GTGTTCGAGG GCAAGACCAC CGGCACGCCC 
ATCTGCCTGC TGATCCGCAA CACCGACCAG CGCAGCAAGG ACTACGGCAA CATCGTCGAG 
ACCTTCCGCC CGGGCCATGC CGACTACACC TACTGGCACA AGTACGGCAT CCGCGACCCG 
CGCGGCGGCG GCCGTTCGTC GGCCCGGCTG ACGGCGCCCG TGGTGGCGGC CGGCGCCGTC 
GCCAAGAAAT GGCTGCGCGA GAAGTTCGGC GTCGAGATCC ACGGCTACAT GTCGCAGCTG 
GGCGAGATCC GGATTCCGTT CCTCGACTGG AACGAGGTGC CGAACAACCC GTTCTTCGCG 
CCCAACGCCG AGATCCTCCC CGAGCTCGAA ACCTACATGG ACGCGCTGCG CCGCGACGGC 
GACTCCGTCG GCGCGCGCAT CGAGGTGGTG GCGACCGGCA TGCCGGTCGG CTGGGGCGAG 
CCGCTGTTCG ACCGCCTGGA CGCCGACATC GCCCATGCCA TGATGGGCCT GAATGCAGTG 
AAGGGCGTGG AGATCGGCGC GGGCTTTCAT GCCGTGTCGC AGCGCGGCTC CGAGCACGGC 
GACGAACTGA CGCCGGCCGG CTTCGTCGGC AACAACGCGG GCGGTATCCT GGGCGGCATT 
TCCACCGGGC AGGACATCTC GGTATCGCTG GCGATCAAGC CGACCTCCAG CATCCGCACG 
CCGCGCCGCT CGATCGACAA GGCGGGCGAG CCGACCGCGG TCGAGACGTT CGGCCGCCAC 
GATCCGTGTG TCGGTATCCG CGCCACGCCG ATCGCCGAGG CGCTGCTGGC GCTGGTGCTG 
ACCGACCATG CGCTGCGCCA TCGTGCCCAA TGCGGCGACG TGGCGGTGGC GACCCCGGCC 
ATCGCCGCCA AGGCGCCGTA A

Protein sequence

MSGNTLGLLF SVTTFGESHG PAIGAVIDGC PPGMALSAED IQPDLDRRKP GTSRHVTQRK 
EEDLVEILSG VFEGKTTGTP ICLLIRNTDQ RSKDYGNIVE TFRPGHADYT YWHKYGIRDP 
RGGGRSSARL TAPVVAAGAV AKKWLREKFG VEIHGYMSQL GEIRIPFLDW NEVPNNPFFA 
PNAEILPELE TYMDALRRDG DSVGARIEVV ATGMPVGWGE PLFDRLDADI AHAMMGLNAV 
KGVEIGAGFH AVSQRGSEHG DELTPAGFVG NNAGGILGGI STGQDISVSL AIKPTSSIRT 
PRRSIDKAGE PTAVETFGRH DPCVGIRATP IAEALLALVL TDHALRHRAQ CGDVAVATPA 
IAAKAP