Gene Sare_3824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3824
Symbol
ID	5703786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4356161
End bp	4357597
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	70%
IMG OID	641273246
Product	6-phosphogluconate dehydrogenase
Protein accession	YP_001538608
Protein GI	159039355
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0362] 6-phosphogluconate dehydrogenase
TIGRFAM ID	[TIGR00873] 6-phosphogluconate dehydrogenase, decarboxylating

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.75231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.03216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGC AGGCACAGAT CGGCGTGACC GGGCTGGCGG TGATGGGGCG CAACCTCGCC 
CGGAACCTGG CCCGCAACGG CCTCACGGTG GCAGTACACA ACCGCTCCCC GGAACGGACC 
CGCGGGCTGG TCGCCGAGCA CGGCGACGAG GGACGGTTCG TGCCCACCGA GTCGATGGCG 
GACTTCGTCG CCGCGCTGGA ACGACCCCGG GCAGTCATCA TGATGGTCAA GGCTGGTGGG 
CCGACCGACG CCGTCATCGA CGAGTTGGTG CCGCTGCTCG ACGCCGGCGA CATCATCGTC 
GACTGCGGCA ACGCCCATTT CGCCGACACC CGGCGGCGCG AGGAGGCGCT GCGCAGGCAC 
GACCTGCACT TCGTCGGCAC CGGCGTCTCC GGCGGCGAGG AGGGTGCGCT GTGGGGGCCG 
AGCATCATGC CCGGTGGATC GGCCGAGTCC TACCGGAAAC TCGGGCCGAT CTTCGAGCGG 
ATTGCGGCGC AGGTGGACGG CGAGCCCTGC TGCCGCCACA TCGGTCCAGA CGGAGCCGGC 
CACTTCGTCA AGATGGTCCA CAACGGCATC GAGTACGCCG ACATGCAGCT CATCGCCGAG 
GCGTACGACC TTCTGCGGGC CGGCCTGGAC GCGACGCCGG CCGAACTGGC GGAGACCTTC 
CGGCAGTGGA ACTCCGGCGA GCTGGAGTCG TTCCTCATCG AGATCACCGC CGACGTGCTC 
GGACACACCG ACGCGAGCAC CGGACAGGCG TTCGTGGACG TCGTCCTCGA CCAGGCCGAG 
CAGAAGGGTA CCGGGCGCTG GACCGTGCAG AGCGCCCTCG ACCTGGGCAT CCCGATCACC 
GGCATCGCCG AGGCCACATT CGCGCGTTCG CTCTCCGGGC ACGCCGACCA ACGGGAGGCC 
ACCCGCCGCG CGTTCGCCGG CACCGGACCG GCCTGGCAGG TAGCGGACCG GGACACCTTC 
GTCGAGGACG TCCGGCGTGC GCTGCTGGCC AGCAAGATCG TCGCGTACGC GCAGGGCTTC 
GACCACATCC GGGCTGGCAG CCAGGAGTAC GACTGGAACA TCGACCTGGG CGGCACCGCC 
ACGATCTGGC GGGGAGGGTG CATCATCCGG GCACGCTTCC TCGACCGGAT CCGTCAGGCG 
TACGACGATC ATCCCGACCT GCCCACCCTG CTGGTGGCAC CGTGGTTCGC CGACACCGTA 
CGCGACGGGG TGCCGGGGTG GCGACGCGTG GTCGCCGAGG CTGCCCAGGC CGGTGTACCC 
ACCCCCGCGT TCGCCTCCTC CCTGTCCTAC TTCGACGCAC TCCGCGCGAA TCGCCTCCCG 
GCGGCCCTGA TCCAGGGTCT GCGGGACAAC TTCGGCGCGC ACACCTACCG CCGGGTCGAC 
CGTGACGGCT CCTTCCACAC GATCTGGGCC GGCGACCACC ACGAGGTCGA AGCCTGA

Protein sequence

MSGQAQIGVT GLAVMGRNLA RNLARNGLTV AVHNRSPERT RGLVAEHGDE GRFVPTESMA 
DFVAALERPR AVIMMVKAGG PTDAVIDELV PLLDAGDIIV DCGNAHFADT RRREEALRRH 
DLHFVGTGVS GGEEGALWGP SIMPGGSAES YRKLGPIFER IAAQVDGEPC CRHIGPDGAG 
HFVKMVHNGI EYADMQLIAE AYDLLRAGLD ATPAELAETF RQWNSGELES FLIEITADVL 
GHTDASTGQA FVDVVLDQAE QKGTGRWTVQ SALDLGIPIT GIAEATFARS LSGHADQREA 
TRRAFAGTGP AWQVADRDTF VEDVRRALLA SKIVAYAQGF DHIRAGSQEY DWNIDLGGTA 
TIWRGGCIIR ARFLDRIRQA YDDHPDLPTL LVAPWFADTV RDGVPGWRRV VAEAAQAGVP 
TPAFASSLSY FDALRANRLP AALIQGLRDN FGAHTYRRVD RDGSFHTIWA GDHHEVEA