Gene Dole_1474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1474
Symbol
ID	5694311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1762579
End bp	1763583
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	59%
IMG OID	641264069
Product	nitroreductase
Protein accession	YP_001529355
Protein GI	158521485
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0778] Nitroreductase [COG2768] Uncharacterized Fe-S center protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAGT CATTAAAACA GGCCTATCTG CCGGATATGA ATTTTCCCGT CCGGACCATT 
GATGCCGAAA AATGCAGCAA GTGCGGCCGG TGTTTCGAAA CCTGCCCCAC CTACGGATAC 
CGTTGGGAAA AAGGCCAGGT GCCCGAGCCC GTGGGCTACG GCGGATTCTC CCAGGCCTGC 
ATCAACTGCG GCAACTGCAT TGCCGTCTGC CCAACCGGCG CTATCACCAT GACCGGCAGC 
TTTGTGATTC CCTCGGGCCG GTATAAGGTG CTGCTGGAGG GGAAAATGGC GGCCCCCCAT 
CCCCTGGGCG CCGAAGAACA GCCCTATGAG ACCATTGAAC CGGAACTCAC CGAGGTGGAA 
AAGGCCATTT ATACCCGCCG CTCCAACCGG CTCTTCAAGG ACAAGCCCGT GCCCCGGGAA 
CTGCTGGCCC GCATTCTGGA GGCGGGACGG TTTGCCCCGT CGGCGGGCAA CTGCCAGCCC 
TACCGGTTTA TCGTGATCAC CAACCAGAAG ATCATCAAGG AGTTCGAGCG CCGGGCCATG 
GGCTCTCTGC GGCTGCTCAA GAACCTCTAC ATGGCAAAGG ACGGCAAACG GTCCACGATC 
AAGAAGATCG TGTTCAGTGT CATCAGCTGG TTTTCGATCA ACAAGATGGA TCCCCGGCCC 
ATCACGGCCA TGGAAAAAGC GGACCACACG GACGGTGCCA TCTACTTCGA CGCGCCGGCG 
GTGATCCTGA TTCTCAAGGA CAAGCGGGGG ATCAGTAATC CGGACCTGGA TACCGGCATC 
TGCGCCCAGA ACATGGTGCT GGCGGCCCAT TCCCTGGGCC TGGGCACCTG CTATGTGTCG 
CTTCCCATGG AGCCGCTTTC CATGCCCCTG ATGGCGGGGT TTCGCAAAAA GCTGGGGATT 
GGAAAACCTT ATGTCGCGGT GACCAGTATT GCCGTGGGCT ATGCCAGGGG AAAGATCGAC 
GGCCCGGTGA AGCGCGACAC GCCCAGGGTG GACTGGAAGC TTTAA

Protein sequence

MFESLKQAYL PDMNFPVRTI DAEKCSKCGR CFETCPTYGY RWEKGQVPEP VGYGGFSQAC 
INCGNCIAVC PTGAITMTGS FVIPSGRYKV LLEGKMAAPH PLGAEEQPYE TIEPELTEVE 
KAIYTRRSNR LFKDKPVPRE LLARILEAGR FAPSAGNCQP YRFIVITNQK IIKEFERRAM 
GSLRLLKNLY MAKDGKRSTI KKIVFSVISW FSINKMDPRP ITAMEKADHT DGAIYFDAPA 
VILILKDKRG ISNPDLDTGI CAQNMVLAAH SLGLGTCYVS LPMEPLSMPL MAGFRKKLGI 
GKPYVAVTSI AVGYARGKID GPVKRDTPRV DWKL