Gene Dhaf_4212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_4212
Symbol
ID	7261232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	-
Start bp	4455353
End bp	4456483
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	49%
IMG OID	643564127
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002460655
Protein GI	219670220
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0000750849
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAA TAGTTTATGA GGGAATTCGG GATGTTAAAG TTAAGAATGT CGGAGATCCG 
GGAATACAAA AGCCTGACGA CATCATTGTT AAGGTCACAT CCACAGCCAT ATGCGGTTCA 
GATCTTCATC TTATTCACGG TATGGTCCCC GGTATGCCCG AGGGGTTTGT TCTTGGTCAT 
GAGACCATGG GCATCGTAGA AGAGGTAGGC GGGGATGTGT ACAACATTAA AAAAGGAGAT 
CGGGTTATTG TGCCTTTTCC TATTGCCTGC GGGCATTGCT GGTATTGTGA ACATGACCTG 
TGGAGTCAGT GTGATAACGC GAATCCTGAA GCCGAAGTGG GAGCGTATTT TGGCTACAGC 
AATACTTTTG GCGGTTATGA TGGGGGACAG GCGGAGTACC TGCGAGTTCC TTACGCCAAT 
GTGGGGCCCA AAGTGGTTCC GGAGGAATTA ACCGACGAAC AGGTCCTCTT CTTAACAGAT 
ATCCTGCCTA CCTCATACTG GGGAGTGGAA ATCGGTGGGG TAAAAAAGGA CGATACAGTG 
GTGGTCCTGG GCTGTGGGCC GGTAGGCCTG CTGACCATCA AATGGGCCAT TTTCCAGGGG 
GCCAAACGAG TCATTGCCGT GGATCATATT AGCTACCGGC TGGATCATGC CTATAGATAC 
TATGGGGTGG AGGTCATTAA CTTTGAAGAT CACGACAACA CCGGCGAGTA TATTAAGGAG 
ATAACTCACG GAGGTGCGGA CGTGGTGATC GACTGTGTAG GTATGGATGG CAAAGCATCC 
ACCCTTGAGA AGATCGAGAC CTTGCTTAAG CTCCAAGGGG GCTCCAAATC AGCCATTGAG 
ATTGCCACTC AGGCAGTGCG AAAAGGTGGA ACCGTAGCTT TGGTAGGTGT CTATGGGTCA 
AAGTATAATC TGTTTCCTTT GGGGGATTTT TTCTCCCGAA ACATTACCTT GAAGATGGGG 
CAATGCCCGG CCCATTCCTA TGTGGAGCCG ATCATGGAAT TGATCAAAAC AGGCCGGTTT 
GATGCTACGG ATATCATTAC TCACCGCCTT TCCTTAGATA AAGGGGAGCA TGCCTATGAG 
GTTTTTGACG AGAAAAAGGA TAACTGCATT AAAGTTGTCT TGAAGCCATA G

Protein sequence

MKAIVYEGIR DVKVKNVGDP GIQKPDDIIV KVTSTAICGS DLHLIHGMVP GMPEGFVLGH 
ETMGIVEEVG GDVYNIKKGD RVIVPFPIAC GHCWYCEHDL WSQCDNANPE AEVGAYFGYS 
NTFGGYDGGQ AEYLRVPYAN VGPKVVPEEL TDEQVLFLTD ILPTSYWGVE IGGVKKDDTV 
VVLGCGPVGL LTIKWAIFQG AKRVIAVDHI SYRLDHAYRY YGVEVINFED HDNTGEYIKE 
ITHGGADVVI DCVGMDGKAS TLEKIETLLK LQGGSKSAIE IATQAVRKGG TVALVGVYGS 
KYNLFPLGDF FSRNITLKMG QCPAHSYVEP IMELIKTGRF DATDIITHRL SLDKGEHAYE 
VFDEKKDNCI KVVLKP