Gene Dole_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2065
Symbol
ID	5694908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2517238
End bp	2518368
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	61%
IMG OID	641264666
Product	nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase
Protein accession	YP_001529946
Protein GI	158522076
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2038] NaMN:DMB phosphoribosyltransferase
TIGRFAM ID	[TIGR03160] nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000207699
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAAAA AAACACCATC CGCTGACACG CCTTTTATTC TTTCTGCTCT GGCTCCCGCC 
ACCCTCTGCC GCGCCACCAT TGACGCTGTT GCCTCGGTGG ACACAACCCT GCTGGCCGAC 
GCCGGCCGAA AAATCGACAA CAAGACAAAA CCCGCCGGCT CCCTGGGCCG GCTGGAAACC 
CTGGCCGTTC AAATGTGCCT GGTCCAGAAC AGGCTGGACC CGGCCATTGG ACAGAAAAAC 
CTTTTTGTGT TTGCCGGGGA CCACGGGGTC ACGGCGGAAG GGGTGTCCGC CTTTCCTTCA 
GAGGTCACGG TCCAGATGGT ACTAAACTTT CTGGCCGGCG GGGCCGCCAT CAATGTGCTG 
TGCCGTCACT ACGGCATTGA CATGAAGGTG GTGGACATGG GTGTGGCAGG GGCGTTTGAA 
GACCACCCGG ACCTGGTCAA AAAGAAAGTG GCGCCGGGCA CGGAAAACCT GGCCCGGCAG 
GTGGCTATGA GCGCCGACGC ATTAAAAACG GCCCTGGAAA ACGGCATGGC TGTTTTTCTG 
GAGGCCCACG CCCGAAAGCC CATCGACATT GTGGGTATGG GCGAAATGGG CATCGGCAAC 
ACCACCCCGG CAACGGCCAT CATCTGCGCC CTTACCGGCA TCTCTCCGGC CGAGGCCACA 
GGCCGGGGCA CCGGCGTGGA CGACGACGGT TTGAAACGAA AGACCGCCGT GATTGAACAG 
GCCCTGAAAC TTCATTGCCC GGATTCGAAA AACGGTTTTG AAGTGCTGCG CACCCTGGGC 
GGGTTTGAAA TTGCGGGCAT GGCCGGGGCC ATTCTGGCCG CGGCGTCAAA ACAGACCGCC 
GTGGTGCTGG ACGGCGTGAT TTCAACGGCC GCCGGGCTGG CGGCCTTTGT TATCTGTCCG 
TCGATCAAGG GGTTTCTGAT CGCGGGGCAC CGGTCCGTGG AACCGGCGCA AAAGGCGGCC 
CTGTCTTTTA TCGGGCTTGA GCCGGTGCTG GATCTTCAAA TGCGGCTGGG CGAAGGCACG 
GGCGCTGTCA TGGCCATGGA TGCGGTGGCA GCGGCCTGCA AGATCATGAC CCAGATGGCC 
TCCTTTGAAG GGGCCGGTGT GTCAACGGCT TCCGGCACGG CCACGGCATA G

Protein sequence

MPKKTPSADT PFILSALAPA TLCRATIDAV ASVDTTLLAD AGRKIDNKTK PAGSLGRLET 
LAVQMCLVQN RLDPAIGQKN LFVFAGDHGV TAEGVSAFPS EVTVQMVLNF LAGGAAINVL 
CRHYGIDMKV VDMGVAGAFE DHPDLVKKKV APGTENLARQ VAMSADALKT ALENGMAVFL 
EAHARKPIDI VGMGEMGIGN TTPATAIICA LTGISPAEAT GRGTGVDDDG LKRKTAVIEQ 
ALKLHCPDSK NGFEVLRTLG GFEIAGMAGA ILAAASKQTA VVLDGVISTA AGLAAFVICP 
SIKGFLIAGH RSVEPAQKAA LSFIGLEPVL DLQMRLGEGT GAVMAMDAVA AACKIMTQMA 
SFEGAGVSTA SGTATA