Gene Dole_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1621
Symbol
ID	5694458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1926385
End bp	1928625
Gene Length	2241 bp
Protein Length	746 aa
Translation table	11
GC content	62%
IMG OID	641264216
Product	nitrate reductase
Protein accession	YP_001529502
Protein GI	158521632
COG category	[C] Energy production and conversion
COG ID	[COG0243] Anaerobic dehydrogenases, typically selenocysteine-containing
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.161606
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGT GGCACAAAAC AGGATGCGTG CTCTGCGCCC AGAACTGCGG GTTGCAGGTT 
TTGGTGGAAA ACAACCGCAT GGTCAAGGTA AAGCCGGATA AAGACAACCC CCGCAGCCGG 
GGCTATGCCT GCCGAAAAGG GCTGAACGTT ATTTATCATC AATACCCCGC CGACCGGATC 
ACCACCCCCC TGAAACGGGT CGGCGCGGAG TTTGTGCCGA TCTCCTGGGA CCAGGCAGCC 
ACGGAGATCG CGGAAAAACT GCGCGCCACC GTTAATGCCC ACGGGCCCAG AAGCGTGGCG 
TACATGGGGG CCAGCTCCCA GGGCGGCCAC ATGGAGGCGG CCTTTGGCCT GACGATACTG 
CGCGCCCTGG GCTCCCAGAA TTTTTACTCT TCCGCGGGCC AGGAGTTTTC AGGCCACTGG 
TGGGTGTTCG GTCGCATGCT GGGCCGGCAG TACAGTGTCA CCGGCCCGGA CGAGCACAAC 
TGCGACATGC TGGTGGCCTG GGGCTGGAAC GGTATGGAAA GCCACCAGGT GCCCCGTGCC 
CCCATCGTGT TAAAGGAGGT CGCCGACAAC CCGGACAAGC TCCTGGTCGC CATCGACCCC 
CGCCGCAGCG AAACCGCCCA GATCGCCAAC ATTCACCTGG CCTTGCGGCC GGGCACTGAC 
GCCCTGCTGA TCAAGGCCAT GATCGCCCTG ATCCTGGCCG AAGGATGGGA AAAGCGCGAC 
TATCTTTTAC AGCACGTGGA AGGATGGGAC GCCATTCGCC CCTGGTTTGA AAATTTTGAC 
ATTCGGGCCG CCATTGCCGT GTGCGGACTG GATTATGGGG AGGTGCTTGA GCTGTGCCGC 
CTGATGGCAA CAAGGCAGTG GGGCGTTCAC CCGGACCTCG GGGTGTTCAT GGGCCGCCGT 
TCCACGCTCA CCTCCTACCT GCTGATGGTG CTGCAACTGG TGTGCGGCCG GCTGCTGGTG 
CCGGGCGGCA ACATCGTACC CGGCATGGTC ATGCCCATGG GGTTTCACGC CGACGAGCGG 
GACGAAAAAA CATGGCGCAC CGTGGCCACC CACATGCCGC CGGCCGCGGC CGGGGCGTTT 
CCCCCGTCGG TGCTGCCCGA AGAGATCCTG ACCGATCATG CAGACCGGGT CCGGGCCGTG 
TATGTGAGCG CCTGCAATCC GTTGCGGTCC TATCCGGACA CCACCGCCTA CGAGACCGCT 
TTTAAAAAGC TGGACCTGCT GGTGGTCAAT GAGATCGTCA TGAGCGAGAC GGCCCGGCTG 
GCCCATTACG TGCTGCCGGC CTGTACGTTT TACGAGTCCT GGGACACCAC GTTTTTTCCC 
ATGTCCTACC CGGAAGTCTA CCTGCAACTG CGGCGGCCTG TTGTATCGCC GCCCGGGGAA 
TGCAAAGAGC TGGCTGAAAT TTTTACCCTG ATCGCCGACC GGCTGGGCCT GATCCCGGAA 
ATCCCGGAGG CCCTGCACCA GGCCGCTGCC GAAGACAGCC TCACATTCGG GGCAAAGCTC 
ATGGAGTGGG CCATGACCGA GCCTTCGGCC CTTGCCGCCA TGCCCTTTGT GCTGGCCAAA 
ACCCTGGGCC GCCAGTGGAA AAGCGCTCAC AAGGCCGCCA TCTGGGGCAT GATGATGACC 
GCGCCCAAAG CCTTTTACAA AAACGCCATG CGGGCCGGGT TCGCGCCGGG CCCGGACCTG 
GGGGACCGCC TGTTTGCCGC CCTCCTGGAC AATCCCCAGG GCATCTGGGT GGGAAAGATT 
GACGACAGCA ATCCCATGGC CGTGTTAAAA ACCCCTTCCG GAAAAATCGA AGCCTTTATT 
CCCGAGCTGG AAGCAGACGT TAAGGCCCTG GACGCGGCTG CCGAGGCCGA AGCCTTGAAA 
ATGCCGGCGG ACTTTCCCCT GGTGCTCAAC GCCGGCCGGC ACATGAGATA CAACATCAAT 
ACCATGATGC GAAACCCGGA GTGGAACAAG GGGAAAAGGG CCTGCACCAT CGCCGTCAGC 
CCTTCGGATG CCGATAAACT GGGGTTTGCC GACGGCGAGA TCGTCCGGAT GGTCACCGAA 
GCGGGAGCCG AGCAGGGCGA ACTGGAGGTG TCAGACAGGG TCCGGCCGGG CATGGTGCTG 
ATCCCCCACG GGTTCGGCCT GAACTACAAC GGCAGCGTCT ACGGGCTCAA CGTGAACCGG 
CTTACCAAAA GCACCAACCG GGATCCCATA GGCACCCCGC TTCACCGGTT TGTGCCCTGC 
CGTCTGGAAA AGATAGAATA G

Protein sequence

MEQWHKTGCV LCAQNCGLQV LVENNRMVKV KPDKDNPRSR GYACRKGLNV IYHQYPADRI 
TTPLKRVGAE FVPISWDQAA TEIAEKLRAT VNAHGPRSVA YMGASSQGGH MEAAFGLTIL 
RALGSQNFYS SAGQEFSGHW WVFGRMLGRQ YSVTGPDEHN CDMLVAWGWN GMESHQVPRA 
PIVLKEVADN PDKLLVAIDP RRSETAQIAN IHLALRPGTD ALLIKAMIAL ILAEGWEKRD 
YLLQHVEGWD AIRPWFENFD IRAAIAVCGL DYGEVLELCR LMATRQWGVH PDLGVFMGRR 
STLTSYLLMV LQLVCGRLLV PGGNIVPGMV MPMGFHADER DEKTWRTVAT HMPPAAAGAF 
PPSVLPEEIL TDHADRVRAV YVSACNPLRS YPDTTAYETA FKKLDLLVVN EIVMSETARL 
AHYVLPACTF YESWDTTFFP MSYPEVYLQL RRPVVSPPGE CKELAEIFTL IADRLGLIPE 
IPEALHQAAA EDSLTFGAKL MEWAMTEPSA LAAMPFVLAK TLGRQWKSAH KAAIWGMMMT 
APKAFYKNAM RAGFAPGPDL GDRLFAALLD NPQGIWVGKI DDSNPMAVLK TPSGKIEAFI 
PELEADVKAL DAAAEAEALK MPADFPLVLN AGRHMRYNIN TMMRNPEWNK GKRACTIAVS 
PSDADKLGFA DGEIVRMVTE AGAEQGELEV SDRVRPGMVL IPHGFGLNYN GSVYGLNVNR 
LTKSTNRDPI GTPLHRFVPC RLEKIE