Gene Sare_5019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_5019
Symbol
ID	5705156
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5688895
End bp	5689872
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	68%
IMG OID	641274412
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001539753
Protein GI	159040500
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000152397
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGGTTG TGCGACGCTT CGGCCCCGGT CACCGCATCC TCGTCACCGG TGGGGCGGGC 
TTCGTACCCT CGCATCTGGT TGAGGCCCTA CTCGCCCGTG GCTGCACGGT CGTGGCGGTG 
GACAACTTCG TGACCGGTTC CAAGGAGAAC GTGGCCCACC TGGCGGACAC GTCGACCTTC 
ACGCTCGTCG AGGCGGACAT CTCCGACGGG CTTCCCGGGC ACCATCCCGC CTTCGCCGAG 
CGGTTCGACG CCATCCTGCA CATGGCATCG CCGGCCAGCC CAACCGACTT CGAGAAGCTG 
CCGGTGGAGA TCCTCCGGGT CGGTTCGGTC GCCACCCTGC ACCTGTTGGA CCGGGCGGTC 
GCCGACGGTG CCCGCTTCCT GCTGGCCTCC ACCTCCGAGG CGTACGGGGA TCCGTTGGAA 
CACCCCCAGC GGGAGACGTA CTGGGGCAAT GTCAACCCAA TCGGCGTCCG GAGCGTCTAC 
GACGAGTCGA AGCGGTTCGC CGAGGCAGCC ACGATGGCGT ACCACCGGAG CCGGGGGGCC 
GACGTCGCTA TTGTCCGGAT CTTCAACACC TACGGCCCAC GGATGAGGCC GGACGATGGC 
CGGGCGATCC CGACGTTCAT CGCCCAGGCT CTGCGCAGCG AGCCGATCAC CGTGCACGGC 
ACCGGCGACC AGACACGCTC CATCTGCTAC GTCGACGACC TGGTGCGAGG CATCCTGCTA 
CTGCTGGACT CGACCGAGAC CGGGCCGGTC AACTGCGGGA CCGAGCACGA GATGAGCATG 
CGACGACTGG CCGAGTCGAT CGTCTCGCTG TGCGGAAGTC CATCCGAGGT CACCTACGTC 
ACCCGTGCTG CGGACGATCC GAAAATGCGC CGCCCGGATC TCACCCGCGC CCGGGAGCTC 
CTCGACTTCG AGCCCGAGAT CACGCCCGAG GAGGGCCTGC ACCGCACCAT CGCGTACTTC 
CGCGAGCGGC TCGGGTAG

Protein sequence

MKVVRRFGPG HRILVTGGAG FVPSHLVEAL LARGCTVVAV DNFVTGSKEN VAHLADTSTF 
TLVEADISDG LPGHHPAFAE RFDAILHMAS PASPTDFEKL PVEILRVGSV ATLHLLDRAV 
ADGARFLLAS TSEAYGDPLE HPQRETYWGN VNPIGVRSVY DESKRFAEAA TMAYHRSRGA 
DVAIVRIFNT YGPRMRPDDG RAIPTFIAQA LRSEPITVHG TGDQTRSICY VDDLVRGILL 
LLDSTETGPV NCGTEHEMSM RRLAESIVSL CGSPSEVTYV TRAADDPKMR RPDLTRAREL 
LDFEPEITPE EGLHRTIAYF RERLG