Gene RSc2969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc2969
Symbol	aroB
ID	1221823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	-
Start bp	3201298
End bp	3202404
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	637239377
Product	3-dehydroquinate synthase
Protein accession	NP_521090
Protein GI	17547688
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.351532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACCG TTGATGTCGA CCTGGGCGAG CGCGCCTATC CGATCCATAT CGGAACCGGG 
CTCCTGTCCC AAGCCGAACT GTTTGCCCCC CATATCCGCG GCACCCGTGC CGTGATCGTC 
ACCAATGAGA CGGTGGCGCC GCTCTATGCC GCTCGGGTCG AAGCCGCGAT CCGCTCGCTG 
GGCAAGACCG TCGACATGGT GGTGCTGCCC GACGGTGAAT CGTTCAAGAC GTGGGAGACG 
CTCAACCGGA TCTTCGATGC ACTCCTGGCC TCGGGCGCTG ACCGCAAGAC CACCCTCGTG 
GCGCTCGGCG GAGGGGTGAT CGGCGACATG ACCGGATTTG CCGCCGCCAG CTATATGCGC 
GGCGTGCCGT TCATCCAGGT GCCGACCACG TTGCTGTCCC AGGTCGATTC GTCGGTGGGG 
GGCAAGACCG GGATCAATCA CCCGCTCGGC AAGAACATGA TCGGTGCGTT CCACCAACCG 
CAGGCGGTGC TGGCCGACAT CGACACGCTG CGCACGCTGC CGCCGCGCGA GCTCGCCGCC 
GGCATGGCCG AAGTCATCAA GCATGGCGCG ATCGCCGATG CCGACTACTT CGCCTGGATC 
GAGCGCCACA TTGCCGGCCT CAATGCTTGC GATGCCGACC TGATGGCAGG AGCCGTGCGC 
GGCTCGGTGC AGATCAAGGC GGCCGTGGTG GCACAGGACG AGCGCGAGTC CGGTCTGCGC 
GCCATCCTCA ACTTCGGCCA CACCTTCGGC CACGCCATCG AAGCGGGCCT GGGGTACGGC 
GAATGGCTGC ACGGCGAGGC TGTCGGCTGC GGCATGGCGA TGGCGGCGGA TCTGTCGCAC 
CGGCTCGGGT TCATCGACAT CGATACGCGC AACCGCGTGA CGGCGCTGAC ACGCGCGGCC 
AACCTGCCGG TGGTGGCGCC CGATCTGGGC GTGGCGCGCT TCATCGACCT GATGCGCGTC 
GACAAGAAGG CCGAGGCGGG CGAGATCAAG TTCGTCCTGC TGCGCAAGCT GGGCCAAGCG 
TTCGTGACCA CGGTACCCGA CACCGACCTG CGCGCCACGC TGCAGCATGC CGTGCTGCGT 
CCGCCCACCG AAGCGCCGGT GGCCTGA

Protein sequence

MITVDVDLGE RAYPIHIGTG LLSQAELFAP HIRGTRAVIV TNETVAPLYA ARVEAAIRSL 
GKTVDMVVLP DGESFKTWET LNRIFDALLA SGADRKTTLV ALGGGVIGDM TGFAAASYMR 
GVPFIQVPTT LLSQVDSSVG GKTGINHPLG KNMIGAFHQP QAVLADIDTL RTLPPRELAA 
GMAEVIKHGA IADADYFAWI ERHIAGLNAC DADLMAGAVR GSVQIKAAVV AQDERESGLR 
AILNFGHTFG HAIEAGLGYG EWLHGEAVGC GMAMAADLSH RLGFIDIDTR NRVTALTRAA 
NLPVVAPDLG VARFIDLMRV DKKAEAGEIK FVLLRKLGQA FVTTVPDTDL RATLQHAVLR 
PPTEAPVA