Gene Sare_0415 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0415
Symbol
ID	5708229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	475061
End bp	476137
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	72%
IMG OID	641269940
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001535335
Protein GI	159036082
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00302013
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCCCG GTGGCCCCTC CGGTGCCCCG GGGGTCGTCG TCGTGACTGG GGTCAGCCGC 
TACCTGGGCG CCCACGTCGC CGCGCGGCTC GCCGCCGACC CGCGTATCGG GCGGGTTATC 
GGCGTCGATC CGCCCGAGTC GGGCGGGGAA CTCACCGGTC TGCTCGACCG GGTCGAGCGG 
GTACGGGCGG ATGCTGGTTC CATCGGTGGC CTGCTCGCCG ACCTCGACGT GGACGCGGTC 
GTGCACCTGG CCCTAGTCAG TGCCCCCGAT CCGCAGCACG GGGGCCGTGC GGCGATGAAG 
GAGCAGAACG TCATCGGCAC GATGCAACTG CTCGCTGCCG CGCAGCATGC CCCCCGGCTG 
AACAAGCTCG TGGTCCGTTC CTCGACCGCG GCATACGGGG CGTCGTTCCG CGACCCGGCC 
GTCTTCACCG AGGAGACCGA GCCGCGCGAG GTGCCGCGTG GTGGCTTCGG CCGGGACATC 
CTGGATATCG AAGGGTATGT GCGAGGTTTC CGTCGCCGTC GGCCCGACGT CACCGCCACG 
GTGCTGCGGT TCGCGCCGTT CCTCGGCTCG ACCGCCGACA CCACGCTCAC CCGCTATTTC 
GCCCAACCGC TGATCCCCAC CGTGTTCGGC CGTGACCCCC GGCTGCAGTT CCTGCACTTC 
GAGGATGCGT TGGAGGTGCT GCACCAGTCG ATCGTCATGG CCCATCCCGG CACCTACAAC 
GTGGCCGGTC CCGGAGTGCT CGCCCTCTCC CAGGCCATTC GGCGGGCCGG CCGGGTAGGG 
GTGCCGGTGC TGGAACCGGG CCTGTCCGGG GCGGCTGCGC TGGCCCGCGC TCTCGGCTTC 
GGCCGCTACG GGCTGGACCA GGTCGACCTG TTCGTGCACG GCCGGGTCGT GGACACGACC 
CGGCTCGAGC GGGAGTTCGG CTTCACACCA CGCTCGACGG CCACGGCGTT CGACGACTTC 
ATCCGCGCCC ACCGCGGTGG CGTCGTGCTG ACCCGGGAGC GGCTTGCCGC CGCCGAGCGG 
CTGGTGCTCG ACGGGGTCCG GCAGGTCCGC TCCGCGGCCG CTCGGGAGCG GCCGTGA

Protein sequence

MTPGGPSGAP GVVVVTGVSR YLGAHVAARL AADPRIGRVI GVDPPESGGE LTGLLDRVER 
VRADAGSIGG LLADLDVDAV VHLALVSAPD PQHGGRAAMK EQNVIGTMQL LAAAQHAPRL 
NKLVVRSSTA AYGASFRDPA VFTEETEPRE VPRGGFGRDI LDIEGYVRGF RRRRPDVTAT 
VLRFAPFLGS TADTTLTRYF AQPLIPTVFG RDPRLQFLHF EDALEVLHQS IVMAHPGTYN 
VAGPGVLALS QAIRRAGRVG VPVLEPGLSG AAALARALGF GRYGLDQVDL FVHGRVVDTT 
RLEREFGFTP RSTATAFDDF IRAHRGGVVL TRERLAAAER LVLDGVRQVR SAAARERP