Gene Dshi_2823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2823
Symbol
ID	5710674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2979098
End bp	2980144
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641268749
Product	aldo/keto reductase
Protein accession	YP_001534157
Protein GI	159045363
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.299574
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAC ACCCCATCGG CCGCGGCGGG CCGGACGTCA CCCGGTTCTG CCTCGGCACC 
ATGACCTTTG GCACCCAGAC CGGGCAGGCC GACGCCCATG CCCAGATCAC CATGGCGCTG 
GAGGCTGGGT TGAACATCCT CGACACTGCC GAAATGTACC CGGTCAACCC GGTCTCGGCC 
GAGACCGTGG GCCTGACCGA AACTATCATC GGGGCCTGGA ACGCGGCCAA CCCGGGGCGG 
CGCGGCGAGT ACGTGCTCGC CACCAAGGTT TCCGGCGAGG GGCTGAAGGC GGTGCGTGAC 
GGCGCACCGA TCTCGCGCGC AACCATCGAA ACGGCGGTGG AAGCCTCCCT GCGCCGGTTG 
CAGACCGACC ATATCGACAT CTACCAGCTG CACTGGCCGA ACCGGGGCTC CTACCATTTC 
CGGCAGAACT GGACCTTCGA TCCGAGTGGG CAGAACAAGT CCGACACGCT CGCCCATATC 
GAGGAGGTGC TGGAAACCGT CGACCGCCTC GTGGCCGCGG GCAAGGTCGG CCATATCGGG 
CTGAGCAACG AGAGCGCCTG GGGCACCGCC CAATGGCTGC GCGTGGCCGA GACCCACGGC 
CTGCCCCGGG TGGTGTCGGT CCAGAACGAG TATTCCATGC TCGCACGGCT CTACGACACC 
GATCTGGCGG AGTTGTCGGT CAACGAAGAG GTCGGGCTGC TGGCCTTCTC GCCCCTGGCC 
ACGGGGCTGC TGACGGGCAA GTACCGGGGC GGCGCGGTGC CCGAAGGCTC CCGCATGTCG 
CTCAACGGCG CGCTGGGCGG GCGGGTGACG GACCGGGTCT GGGGCGCGGT CGACGCCTAT 
GCCGCCATCG CCGAGGCCCA CGGGCTCGAC ATGACCCATA TGGCGCTCGC GTGGTGCGCG 
CAGCGGCCCT TCATGGGCTC GGTGATCTTC GGCGCGACCA CGCGGGACCA GCTGGCTCAT 
ATCCTCGACG GTCTGGACCT GCGCCTGTCG CCGGAGGTGC TGGCCGAGAT CGACGCCGCC 
CACAGGGCGC ATCCGATGCC GTTCTAG

Protein sequence

MQKHPIGRGG PDVTRFCLGT MTFGTQTGQA DAHAQITMAL EAGLNILDTA EMYPVNPVSA 
ETVGLTETII GAWNAANPGR RGEYVLATKV SGEGLKAVRD GAPISRATIE TAVEASLRRL 
QTDHIDIYQL HWPNRGSYHF RQNWTFDPSG QNKSDTLAHI EEVLETVDRL VAAGKVGHIG 
LSNESAWGTA QWLRVAETHG LPRVVSVQNE YSMLARLYDT DLAELSVNEE VGLLAFSPLA 
TGLLTGKYRG GAVPEGSRMS LNGALGGRVT DRVWGAVDAY AAIAEAHGLD MTHMALAWCA 
QRPFMGSVIF GATTRDQLAH ILDGLDLRLS PEVLAEIDAA HRAHPMPF