Gene Dret_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1446
Symbol
ID	8419275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1676959
End bp	1678110
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	56%
IMG OID	645038021
Product	aldo/keto reductase
Protein accession	YP_003198311
Protein GI	258405569
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00469922
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.148441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATACA GAGTCATGGG ACGCACCGGC GAACGCGTAG CCGCTTTAGG TCTCGGATGT 
ATGCGTTTTC CGGTCGTTGA TGGTGACGAC GGCTGCATTG ACGAGCCGCG GGCGACCGTG 
TTGTTGCGCG AAGCCATTGA CGCTGGAGTG AATTATCTGG ACACGGCATA CCCCTACCAC 
AAGGGGGCCA GCGAACCTTT TGTCGGTCGC GCTCTTCAGG GAGGCTACCG GGACAAGGTC 
CATCTAGCGA CGAAATTGCC CTCCTGGGCC ATTGAAAGCG CCGAGGATTT TGACCGCTAC 
CTGGATGAAC AATTACAACG TCTCCAGACC GGGCACATCG ACTTTTATCT TTTGCACGCC 
TTGAAAGGGG AGTGGTGGCG GAAACTGCGT GATCTGGGCG TTCTGTCTTT TCTTGACCGG 
GCCGTTGCCG ATGGCCGGAT TAAGTACGTC GGGTTTTCCT TTCATGATGA GTGGGCGCAG 
TTTAAGGAGA TAGTCGACGC CTACGAATGG GATTTTTGTC AGATCCAGTA TAACTACATG 
GACGAAGATA TTCAGGCCGG CAGTAAGGGT CTTTATTACG CCGCTAACAA GGGACTGGGC 
GTTGTGGTCA TGGAGCCGTT GCGCGGCGGG AGTCTGGCCT CGACTGTACC AGAGCCGGTC 
CAATCTATTT GGGATGAGGC CGAGCCGAAA CGGACACCGG CGGAATGGGC TTTGCGCTGG 
GTCTGGGACC ATCCTGAAGT TTCGGTGGTC TTAAGCGGTA TGAACAGCCG GGCGCAGCTC 
CACGAGAATT GCCGGGTCGC CGACGAAGCT ACGCCCGGCA GCTTGTCGAC CGACGATTAT 
GAGCGCATCG GCCGTGTTCG ACAGATCTAC AGGGAACGCA TCCAGATCCC GTGCACGAGC 
TGCGGTTATT GTCTGCCCTG TCCGAGCGGG GTGAATATTC CGCGGATCTT TTCGATCATG 
AACGACAGGT TCATCTACGA CGCCACCCAT TGGTCGCAGG TCATGTATAA TGTGGCGACG 
AACAGCGATG AAAACGCGGC CAATTGCGTT CAATGTGGGG CCTGTGAAGA GGTGTGCCCA 
CAGCAGATAC CGATTATGGC CAAATTGCAG GAGTGTCACG AAACATTGGC ACAGGCGGAG 
GAATCGGACT GA

Protein sequence

MQYRVMGRTG ERVAALGLGC MRFPVVDGDD GCIDEPRATV LLREAIDAGV NYLDTAYPYH 
KGASEPFVGR ALQGGYRDKV HLATKLPSWA IESAEDFDRY LDEQLQRLQT GHIDFYLLHA 
LKGEWWRKLR DLGVLSFLDR AVADGRIKYV GFSFHDEWAQ FKEIVDAYEW DFCQIQYNYM 
DEDIQAGSKG LYYAANKGLG VVVMEPLRGG SLASTVPEPV QSIWDEAEPK RTPAEWALRW 
VWDHPEVSVV LSGMNSRAQL HENCRVADEA TPGSLSTDDY ERIGRVRQIY RERIQIPCTS 
CGYCLPCPSG VNIPRIFSIM NDRFIYDATH WSQVMYNVAT NSDENAANCV QCGACEEVCP 
QQIPIMAKLQ ECHETLAQAE ESD