Gene Strop_1847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1847
Symbol	aroB
ID	5058306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2114113
End bp	2115186
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	73%
IMG OID	640474117
Product	3-dehydroquinate synthase
Protein accession	YP_001158687
Protein GI	145594390
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAAGA CAACCCGAAT CGCGGTTGGT GGTGACCGAC CGTACGACGT GTTGGTGGGG 
CGGGACCTGC TCGACCCGCC ACAGTTGCTG CCGGGCGCGC AGCGGCTGGC CGTGCTGTAC 
GCGCCGCCGA TGCGGGGCCG GGCCGAGCAG CTGGCGGAGC GGGCCCGGAT GGCCGGGGTG 
ACGCCACTGC TGGTCGAGGT GCCGGACGCG GAGGCGGGCA AGCACATCGA GGTCGCCGCC 
AGCTGCTGGG AACGGCTCGG TGCGGCGGGC TTCACCCGCG CCGACGCCGT CGTCGGTGTG 
GGTGGCGGCG CGGTTACCGA CCTGGCTGGC TTCGTCGCGG CCTGCTGGCT GCGCGGGGTG 
CGTTGGGTGC CGGTGGCGAC GTCGTTGCTG GGCATGGTTG ACGCGGCGGT GGGCGGCAAG 
ACCGGGATCA ATACCGCCGC CGGCAAGAAC CTGGTCGGTG CCTTCCACCC GCCGGCCGGG 
GTGATCTGCG ACCTGGCTGC TCTGGACAGC CTCTCCCCGG CCGACCTGGC CGCGGGAATG 
GCCGAGGTGA TCAAGTGTGG CTTCATCGCC GACCCGGTGA TCCTCGAGCT GGTCGAGCGG 
GACCCCGCCG TCGCCGTTGA CCCGGCGGGT CCGGTGCTCC GGGAGCTGAT CGAGCGGGCG 
ATCCGGGTCA AGGCGCAGGT CGTCTCCGGT GACCTTCGCG AGTCGGGGGC CCGGGAGATC 
CTCAACTACG GGCACACCCT GGCGCATGCC ATCGAGAAGG TGGAGGGCTA CCGCTGGCGG 
CACGGCCACG CGGTCGCGGT GGGGCTGGTC TACGCGGCGA CCCTGGCCCT GCTCGAAGGC 
CGGCTGGACG CGCAGACCGC GCAGCGGCAC CGGGCGGTGG TGGGCGCGCT CGGCCTGCCC 
ACCGGATACC GGGCGGAAGC CTGGCCGGAC CTGCTCGCCA CGATGCGGGT GGACAAGAAG 
GCGCGGGGCA GCGTCCTGCG CTTCGTGGTG TTGGCCGGTC TCGCCCACCC CACGATCCTC 
GAGGCGCCCT CCGACGAACT GCTGCACGCC GCCTACCGGG AGATCGCCGA ATGA

Protein sequence

MDKTTRIAVG GDRPYDVLVG RDLLDPPQLL PGAQRLAVLY APPMRGRAEQ LAERARMAGV 
TPLLVEVPDA EAGKHIEVAA SCWERLGAAG FTRADAVVGV GGGAVTDLAG FVAACWLRGV 
RWVPVATSLL GMVDAAVGGK TGINTAAGKN LVGAFHPPAG VICDLAALDS LSPADLAAGM 
AEVIKCGFIA DPVILELVER DPAVAVDPAG PVLRELIERA IRVKAQVVSG DLRESGAREI 
LNYGHTLAHA IEKVEGYRWR HGHAVAVGLV YAATLALLEG RLDAQTAQRH RAVVGALGLP 
TGYRAEAWPD LLATMRVDKK ARGSVLRFVV LAGLAHPTIL EAPSDELLHA AYREIAE