Gene Sare_2173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2173
Symbol
ID	5704957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2497669
End bp	2498667
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	72%
IMG OID	641271655
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001537026
Protein GI	159037773
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0967474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0101731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACAG TGCGCAGATG CCTGGTCACC GGCGGCTTCG GCTTCCTTGG TAGCCATGTG 
GTCGAACGGC TGCTGCACCG GGGGGACGAA GTCGTGGTCT ACGACCCGGC CGGACCACCA 
CCGGACCTGC GCGCTCCCGC CGGCCGTCTT CGGCACGTGC CCGGCGACGT CCGGGACGCC 
GAGCGCCTGA TCACCGCCGC CGAGGGCGTG GACGAGGTCT ACCACCTGGC AGCGGTCGTC 
GGTGTCGACC GGTACCTGCG GCGGCCGCTC GACGTGGTGG AGGTCAACGT GGGCGGAACC 
CACAACGCGC TGCGGGCGGC CCGGCGCGCC GGCGCGCGGA TCGTGGTGTC CAGCACCAGC 
GAGGTCTACG GGCGCAATCC CCGCGTGCCG TGGCGGGAGG ACGACGACCG GGTGCTCGGC 
AGTACCGCGA CCGACCGGTG GTCGTACTCG ACGAGCAAGG CAGCGGCCGA ACACCTCGCC 
TTCGCGTACC ACCGACAGGA GGGGCTGCCG GTGACGGTGC TCCGGTACTT CAATGTCTAC 
GGTCCACGCC AGCGTCCGGC GTACGTGTTG AGCCGTAGCA TCGTCCGCAT GCTGCGGGGC 
GAACCGGCCG TGGTGTACGA CGACGGCCGG CAGACCCGGT GTTTCACCTG GGTGGACGAG 
GCGGTGGAGG CGACGCTGTC GGCTGCGGGA CTGCCTCGGG CGGTCGGCGA GTGTTTCAAC 
ATCGGCAGCA GCGTGGAGAC GACCATCGGC GAGGCGATCC GCATGGTCGG CAGCGTCGCC 
GGCGCGCCCG GGCCGGCCCT GACCGTACCT ACCGGGGCCG GCCCGGGCGC TCACTACCAG 
GACATTCCCC GCCGGCTCCC GGACTGCGGC AAGGCCGCGG CGCTGTTGGG GTGGCGGGCT 
CGAATGCCGC TGCTGGAGGG CCTGGGCCGG ACCGTCGAGT GGGCCCGCCG AAATCCGTGG 
TGGACGGCGC AGGCCGACGA CGGGCTGGGG GTCCGTTAG

Protein sequence

MTTVRRCLVT GGFGFLGSHV VERLLHRGDE VVVYDPAGPP PDLRAPAGRL RHVPGDVRDA 
ERLITAAEGV DEVYHLAAVV GVDRYLRRPL DVVEVNVGGT HNALRAARRA GARIVVSSTS 
EVYGRNPRVP WREDDDRVLG STATDRWSYS TSKAAAEHLA FAYHRQEGLP VTVLRYFNVY 
GPRQRPAYVL SRSIVRMLRG EPAVVYDDGR QTRCFTWVDE AVEATLSAAG LPRAVGECFN 
IGSSVETTIG EAIRMVGSVA GAPGPALTVP TGAGPGAHYQ DIPRRLPDCG KAAALLGWRA 
RMPLLEGLGR TVEWARRNPW WTAQADDGLG VR