Gene Sare_2339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2339
Symbol
ID	5707967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2691098
End bp	2692102
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	71%
IMG OID	641271817
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001537188
Protein GI	159037935
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0370756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0889477
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGTGA AGCGTCCCCT CGTTGTGCTG CTCGGTGCGA CCGGCTTCGT CGGCTCCGCC 
GTGCTACGCG AGCTCGCCGT GCGTGACGTT CGGGTGCGGG CCGTCTCGCG CGGCGCGGCC 
TCGGTCCCCG AGGACGCCCG CGCCGAGATC GAGGTGCACA CCGCCGACCT CACCGAGCCT 
GGCCGCCTGG CCCAGGCCAT TGCCGGTGCC GACGTCGTCA TCCACACCAT CGCCTACATC 
GCCGGCTCGA CGACCTGGCG TATCAACGAA GGTGACTCGG CTGCCGAGCG CGTCAATGTC 
GGTCTGGTCC GCGACCTGGT CGCGGTGCTG CGGGACGGCG ACCGGAACCT CCCGCCCCTG 
CCCGTGGTCT TCGCGGGCGC CGTCTCGCAG GTCGGGCCCA CTGACAAGGA GGTGCTCGAC 
GGCAGCGAGC CCGACTGGCC CCAGGGCGAG TACGACCGGC AGAAGCTCGC CGCCGAACGG 
GTGCTGCTCG ACGCGCACGC GGAGAGGATC CTGCGAGCTG TGTCGATCCG GCTTCCCACG 
GTGTTCGGGT ACGGCCCACG TTCCACCGCC CGGGACAAGG GTGTGGTGTC CACCATGGTG 
CGTCGGGCCC TGGCCGGGGA ACCGATCACC ATGTGGCACG ACGGTACGGT GCGCCGGGAC 
CTGCTCTACG TCGAGGACGT GGCGCGGGCG CTTGTCGCGG CGGTCGACCA CGTTGACGCC 
CTGGCCGGGC GGCCGTGGCT ACTCGGATCC GGGCGTGGGC TGCCCCTGGG CGAGGTGTTC 
ACCACGGTGG CGAGTCTGGT CGCCGAACGT ACCGGCAAGC CGCCTGTGCG GGTCGTCTCG 
GTGCCCCCAC CCGAGCACGC CGAGCCAGGT GACTTCCACA ACATCACGAT CGACGCGACC 
CCGTTCCGGT CGGTCAGCGG CTGGCGCCCG AAGGTACCGC TGACCGATGC GCTGCGTCAC 
ACGGTCGACT TCTGTGCCAG TGGTGCCGAG GAGGGCCTGT CGTGA

Protein sequence

MAVKRPLVVL LGATGFVGSA VLRELAVRDV RVRAVSRGAA SVPEDARAEI EVHTADLTEP 
GRLAQAIAGA DVVIHTIAYI AGSTTWRINE GDSAAERVNV GLVRDLVAVL RDGDRNLPPL 
PVVFAGAVSQ VGPTDKEVLD GSEPDWPQGE YDRQKLAAER VLLDAHAERI LRAVSIRLPT 
VFGYGPRSTA RDKGVVSTMV RRALAGEPIT MWHDGTVRRD LLYVEDVARA LVAAVDHVDA 
LAGRPWLLGS GRGLPLGEVF TTVASLVAER TGKPPVRVVS VPPPEHAEPG DFHNITIDAT 
PFRSVSGWRP KVPLTDALRH TVDFCASGAE EGLS