Gene Sare_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2117
Symbol
ID	5704971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2438843
End bp	2440177
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	68%
IMG OID	641271602
Product	UDP-glucose 6-dehydrogenase
Protein accession	YP_001536973
Protein GI	159037720
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.95445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00397041
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCCACAGG ACCCGGCCGT CGTCGTGATC GGCCTCGGCT ACGTCGGATC ATGCGTCGCG 
GCGACACTCG CCGACCGCGG ACTGCGGGTC ACCGGAATCG ACACGGACAC CCGGCTCGTC 
AGCGAACTTT CCCAGGGAAG CACCCCGCTG CACGAGCCCG GCCTGCAGGA GGCCGTGGCC 
CGTGCCACGA CGTCCGGCCG GCTGCGGGCG ACCACCGATG TCGCCGCCGT CGCCGACGCC 
GACATCGTGA TCGTCGCGGT CGGCACCCCG GTCCGCGAGG ACGGCACCCT GGTCGACGAT 
CAGCTTCGTA GTGCCTGTAC CGCGATCGGC CGTCACCTGC GCCGGGGTCA ACTCGTGCTG 
CTCAAGAGCA CCGTTCCGGC GGGTACCACC CGGTCGCTGG TGGTACCGCT GCTGGAACGA 
CACGGAGGTG TGACCGCTGG TACCGACTTC GCGTTGGCCT TCACGCCCGA GCGCCTGGCC 
GAGGGCACCG CGCTAGCCGA GCTGACCAGC CTCCCGATCG TGGTGGGTGG AATCGACGAG 
CGCAGCACCC AGTTGGCGGC CGACTTCTGG CAGCGGGCGC TCGGGGTCAC GGCACTGCGC 
CAAGCGTCAC TGGAGGCCGC CGAGATCGTC AAACTTGCCG ACAACTGGTG GATCGACCTG 
AACATCGCAC TGGCCAACGA ACTGGCAAAG TTCTGCGCAC TGTTTGATGT GGACGTGCTC 
GATGTGATCA CCGCCGCCAA CTCGATCCCC AAGGGCAACG GCAAGGTGAA CATCCTGCTG 
CCCAGCGTCG GTGTGGGTGG GTCCTGCCTG ACCAAGGATC CGTGGATGGT GTGGGAGTCC 
GCCCGACAAC ACGGCCTCGA CATCCAGACT CCACGCGTCG GCCGCGAGGT GAACGCCGGT 
ATGCCGGACC ACACCGCCCA GCTGATCATC GACGAGATGG CCGAACTGGG CCGCGATCCG 
GCCGCCGCGA CGGTGGCGGT GCTCGGACTC GCGTTCAAGA ACAACACCTC CGACCTGCGG 
GCAACCCCGG TGCTCGGGGT GGTCAACGCG CTGGTGAAGG CGGGCGCGCG GGTCCGACTG 
TACGACCCGG TGGTTGATCC CGGGCAGGCA GACGAGATGT TCGGTATCCG ACCGACGACG 
AACCTGCACG ACGCCGTCCG CGGCGCCGAC TGCGTCGCCG TACTGGCGAT GCACCGGCAG 
TTCGACGACA TCGATTTCGC CGACCTGCCC GTCGCAGACT CCTGCCTTCT GCTGGATGGC 
CGGGCCTACT ACCCGAAGGA GAAGATTGTC ATGCTGCGTG AACTGGGCTA CCGCTACCGG 
GGGATCGGGC GGTGA

Protein sequence

MPQDPAVVVI GLGYVGSCVA ATLADRGLRV TGIDTDTRLV SELSQGSTPL HEPGLQEAVA 
RATTSGRLRA TTDVAAVADA DIVIVAVGTP VREDGTLVDD QLRSACTAIG RHLRRGQLVL 
LKSTVPAGTT RSLVVPLLER HGGVTAGTDF ALAFTPERLA EGTALAELTS LPIVVGGIDE 
RSTQLAADFW QRALGVTALR QASLEAAEIV KLADNWWIDL NIALANELAK FCALFDVDVL 
DVITAANSIP KGNGKVNILL PSVGVGGSCL TKDPWMVWES ARQHGLDIQT PRVGREVNAG 
MPDHTAQLII DEMAELGRDP AAATVAVLGL AFKNNTSDLR ATPVLGVVNA LVKAGARVRL 
YDPVVDPGQA DEMFGIRPTT NLHDAVRGAD CVAVLAMHRQ FDDIDFADLP VADSCLLLDG 
RAYYPKEKIV MLRELGYRYR GIGR