Gene Sare_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1840
Symbol	aroB
ID	5704703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2124955
End bp	2126028
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	72%
IMG OID	641271341
Product	3-dehydroquinate synthase
Protein accession	YP_001536716
Protein GI	159037463
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.766033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGG TTACCCGGAT CGCGGTTGGT GGCGACCGAC CGTACGACGT GCTGGTGGGG 
CGTGACCTGT TCGACCCGCC GCAGTTGCTG CCCGGCGCGC AGCGGCTGGC CATCCTGTTC 
GCGCCGCCGT TGCAGGGCCG GGCCGAACAG GTGGCGGAGC GGACCCGGAT GGCCGGGGTG 
GCGCCACTGC TGATCGAGGT GCCCGACGCC GAGGCGGGCA AGCACATCGA TGTGGCCGCC 
GCCTGCTGGG AGCGGCTCGG CGCCGCGGGT TTCACCCGCA CCGACGCCGT CGTCGGTGTG 
GGTGGCGGCG CGGTCACCGA CCTGGCCGGG TTCGTTGCGG CCTGCTGGCT GCGTGGGGTG 
CGCTGGGTGC CGGTGGCGAC GTCGCTGCTG GGCATGGTCG ACGCGGCCGT GGGCGGCAAG 
ACCGGGGTCA ACACTGCCGC CGGCAAGAAC CTGGTCGGCG CCTTTCACCC GCCGGCCGGG 
GTGATCTGTG ATCTGGCCAC GTTGGACACC TTGCCCCCGG CTGACCTGGC CGCCGGGATG 
GCCGAGGTGG TCAAGTGCGG CTTCATCGCC GACCCGGTGA TCCTTGAGCT GGTCGAGCGG 
GAGCCCGCCG CCGCCGTGGA CCCGGCAGGT CCGGTGCTCC GGGAGCTCGT CGAGCGGGCG 
ATCCAGGTCA AGGCGCACGT CGTCGCCGGT GATTTTCGTG AGTCGGGGGC CCGGGAGGTG 
CTGAACTACG GGCACACCCT GGCGCACGCG ATCGAGAAGG TGGAGGGCTA CCGCTGGCGG 
CACGGTCACG CGGTGGCGGT GGGCCTGGTC TACGCGGCGA CCCTGGCCCG GCTCGCCGGT 
CGGCTGGACG CGCAGACCGA GCAGCGGCAC CGGGCTGTGG TGGGCGCCCT TGGTCTGCCC 
ACCAGCTACC GGTCGGACGC CTGGCCGGAA GTGCTCGCCA CGATGCGGGT GGACAAGAAG 
GCGCGGGGCA ACGTCCTGCG TTTCGTGGTG CTGACCGGTC TCGCTCACCC GACGATCCTG 
GAGGCGCCCT CCGACGAGCT GCTGCACGCG GCCTACCGGG AGATTGCCCC ATGA

Protein sequence

MDEVTRIAVG GDRPYDVLVG RDLFDPPQLL PGAQRLAILF APPLQGRAEQ VAERTRMAGV 
APLLIEVPDA EAGKHIDVAA ACWERLGAAG FTRTDAVVGV GGGAVTDLAG FVAACWLRGV 
RWVPVATSLL GMVDAAVGGK TGVNTAAGKN LVGAFHPPAG VICDLATLDT LPPADLAAGM 
AEVVKCGFIA DPVILELVER EPAAAVDPAG PVLRELVERA IQVKAHVVAG DFRESGAREV 
LNYGHTLAHA IEKVEGYRWR HGHAVAVGLV YAATLARLAG RLDAQTEQRH RAVVGALGLP 
TSYRSDAWPE VLATMRVDKK ARGNVLRFVV LTGLAHPTIL EAPSDELLHA AYREIAP