Gene Rpic12D_2900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpic12D_2900
Symbol	aroB
ID	8020572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia pickettii 12D
Kingdom	Bacteria
Replicon accession	NC_012856
Strand	-
Start bp	3057733
End bp	3058839
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	64%
IMG OID	644831687
Product	3-dehydroquinate synthase
Protein accession	YP_002982842
Protein GI	241664482
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.146748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACCG TTGATGTTGA CCTTGGCGAT CGCGCCTATC CGATCCATAT CGGCTCGGGG 
CTGTTGTCCA AGGCCGAGTT GTTTGCCCCA CACATTCGCG GCGCGCGTGC CGTGATCGTC 
ACCAACGAGA CCGTCGCACC GTTGTATGCG GCGAAGGTCG AAGCGGCCAT TCGTTCGCTC 
GGCAAGGCGG TCGACACGGT TGTATTGCCT GATGGGGAAT CGTTCAAGAA GTGGGACACG 
CTCAACCGCA TCTTTGATGC GCTGTTGAAG GCGGGTGCGG ATCGCAAGAC CACGCTGATC 
GCGCTGGGCG GCGGCGTTGT CGGCGACATG ACCGGCTTTG CCGCCGCCTG CTACATGCGC 
GGTGTGCCGT TCATCCAGGT GCCGACGACG CTGCTCTCAC AAGTCGACTC TTCGGTGGGC 
GGCAAGACGG GCATCAACCA CCCGCTGGGC AAAAACATGA TCGGCGCGTT CCACCAGCCG 
CAGGCGGTGC TGGCCGATAT CGATACGCTG CGCACGTTGC CTGCCCGAGA GCTGGCGGCC 
GGTATGGCCG AGGTCATCAA GCATGGCGCA ATCGCCGATG CGGGGTACTT CGCCTGGATC 
GAGCAAAACA TCAAGGGTCT CAACGGTTGC GATACCGGCC TGATGGCCGA AGCCGTGCGT 
GGCTCGGTGC GCATCAAGGC CGCAGTCGTG GCACAGGATG AGCGCGAGAC CGGCCTGCGT 
GCCACCCTCA ATTTCGGTCA CACCTTTGGC CACGCCATCG AGGCCGGCCT GGGCTACGGT 
GAATGGCTGC ACGGCGAAGC CGTCGGCTGT GGCATGGTGA TGGCGGCGGA TCTGTCGCAT 
CGACTGGGCT TTATCGACAT CGACACGCGC AACCGCATCA CCGCGCTCAC GCGTGCGGCG 
AACCTGCCGA CGGTGGCGCC GGACCTCGGC GTTGATCGCT TCATCGACCT GATGCGCGTC 
GACAAGAAGG CCGAAGCCGG CGAGATCAAG TTCGTGCTGC TGCGCAAGCT GGGCCAGGCT 
TTCGTGACCG CGGTGCCCGA TGCGGACTTG CGCGCCACCT TGCAGCACGC CGTCCTGCGA 
CCACCGACCG AAGCACCCAT CGCCTGA

Protein sequence

MITVDVDLGD RAYPIHIGSG LLSKAELFAP HIRGARAVIV TNETVAPLYA AKVEAAIRSL 
GKAVDTVVLP DGESFKKWDT LNRIFDALLK AGADRKTTLI ALGGGVVGDM TGFAAACYMR 
GVPFIQVPTT LLSQVDSSVG GKTGINHPLG KNMIGAFHQP QAVLADIDTL RTLPARELAA 
GMAEVIKHGA IADAGYFAWI EQNIKGLNGC DTGLMAEAVR GSVRIKAAVV AQDERETGLR 
ATLNFGHTFG HAIEAGLGYG EWLHGEAVGC GMVMAADLSH RLGFIDIDTR NRITALTRAA 
NLPTVAPDLG VDRFIDLMRV DKKAEAGEIK FVLLRKLGQA FVTAVPDADL RATLQHAVLR 
PPTEAPIA