Gene Dole_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2010
Symbol
ID	5694850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2435170
End bp	2436864
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	60%
IMG OID	641264608
Product	peptide synthase
Protein accession	YP_001529891
Protein GI	158522021
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACCAG AAAACCACAA CCCGGTGATC AATATTGCGG CCCGCATGAC GCAAATGGCC 
CGGCAGCATC CCTACAAAAA AGCGGTGATC GCGCCCCAGG GACGGGACCG GGCCGGACGG 
GTCACCTATG CCCACTTCAC CTTTGCCCAG TTGGACGCCG ACTCCAGCCG CCTGGCCTCG 
GGCCTGGAAA AGGCCGGTAT TCGCCGGGGC ACCCGCACCA TTCTCATGGT ACGGCCCAGC 
CTGGACTTTT TTTCCCTGGT CTTTGCCCTG TTCAAGGCCG GCATCGTGCC GGTGGTGGTG 
GACCCGGGCA TGGGGGTAAA GCGCATGGTG AGCTGTTTTG CTGAAACCGA TCCCCAGGCC 
TTTATCGGCA TTCCCCTGGC CCATGTGGTG AGAAAAATCT ACCCGAAATT CTTCAAAACC 
GTTGAAACAT GGGTCACCGT GGGAAATCGC TGGTTCTGGG GCGGCCACAC CCTGGACCGA 
ATCCGCGCAT CGGGCACAGA GGATTATAAA ACAGCCGAAA CCCTGTCAGA TGAAACCGCG 
GCCATTCTGT TTACAACGGG CAGCACCGGC CCGGCCAAGG GCGTGGTCTA CACCCACGGC 
AATTTTGACG CCCAGATTCA GCATATTCAG GACCATTTCC AAATCGGTTC CGACGAGACC 
GACCTGCCCA CATTCCCGCT GTTTGCCCTG TTTGACCCGG CCCTGGGCAT GACCGCCGTG 
ATTCCGGACA TGGATCCCAC CAAGCCGGCC TTTGTCAACC CGGAACGCAT TCTCGAGGGC 
ATTGCCAACC ACGGGGTGAC CAACATGTTT GCCTCCCCTG CCCTGCTCAA CCGGGTGGGC 
GGTTACTGCA AGAAACGCAA CATTGTCCTG CCGTCGCTGC GGCGGGTGGT GTCGGCCGGC 
GCCCCGGTTC ACCCGTCCAA CATCGAGCAG TTCGCGTCGG CCCTGACCGA TGAGGCCGAA 
GTGCACACGC CCTACGGCGC GTCCGAGGCG GTGCCCATCA TCTCCATCGG CAGCCGGGAG 
ATCCTGACCG AGACCAAGCA GATGAGCGAG CAGGGGTTCG GCAACTGCGT GGGCCGGCCC 
CTGGAAGGCA TTGAGGTAGA GCTGATCACT ATTTCAGACA GGCCCATTGA GGCGTGGTCC 
GACGACCTGC TGGTGGCCCC CGGTGATGTG GGAGAGTTTG TGGTCAAGGC AGACCTGGTC 
ACCCGTTCTT ACTACAACCG GCCGAAAGAC ACGGCAGGGG CCAAGATACC CGACGGGGAC 
GGTTTCTGGC ACCGCATGGG AGACCTGGCA TGGATGGACA ACCACGGCCG GTTCTGGTTC 
TGCGGCAGGA AGAGCCACCG GGTGGAGTGT GCGGACCGGA CCCTGTTCAC CGTCCCCTGC 
GAGGCCATCT TCAACAACCA TCCCCATGTG GCCAGAAGCG CCCTGGTGGG TGTGGGCCCG 
GCGGGAGGTC AGACACCGGT GATCTGTATC GAGGTGATCA AGGAAAAACG GATTCGAAAA 
AAAGAGCTGG CATCTGAACT GTTAGACCTT GCCCGGACCC ATGAACTGAC AAAGTCCATC 
AAGACCGTCC TGTTTCACGA CAACTTTCCC GTGGATATCC GGCACAACTC GAAAATCTTC 
AGGGAAAAGC TGGCGGTGTG GGCCGCGAAA AAGATAAAAA CAAAACCGCG TCCTTCTCCA 
AAAAAGCGGG GATGA

Protein sequence

MAPENHNPVI NIAARMTQMA RQHPYKKAVI APQGRDRAGR VTYAHFTFAQ LDADSSRLAS 
GLEKAGIRRG TRTILMVRPS LDFFSLVFAL FKAGIVPVVV DPGMGVKRMV SCFAETDPQA 
FIGIPLAHVV RKIYPKFFKT VETWVTVGNR WFWGGHTLDR IRASGTEDYK TAETLSDETA 
AILFTTGSTG PAKGVVYTHG NFDAQIQHIQ DHFQIGSDET DLPTFPLFAL FDPALGMTAV 
IPDMDPTKPA FVNPERILEG IANHGVTNMF ASPALLNRVG GYCKKRNIVL PSLRRVVSAG 
APVHPSNIEQ FASALTDEAE VHTPYGASEA VPIISIGSRE ILTETKQMSE QGFGNCVGRP 
LEGIEVELIT ISDRPIEAWS DDLLVAPGDV GEFVVKADLV TRSYYNRPKD TAGAKIPDGD 
GFWHRMGDLA WMDNHGRFWF CGRKSHRVEC ADRTLFTVPC EAIFNNHPHV ARSALVGVGP 
AGGQTPVICI EVIKEKRIRK KELASELLDL ARTHELTKSI KTVLFHDNFP VDIRHNSKIF 
REKLAVWAAK KIKTKPRPSP KKRG