Gene Dole_2545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2545
Symbol
ID	5695396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3079772
End bp	3080899
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	61%
IMG OID	641265154
Product	HEAT repeat-containing PBS lyase
Protein accession	YP_001530426
Protein GI	158522556
COG category	[C] Energy production and conversion
COG ID	[COG1600] Uncharacterized Fe-S protein
TIGRFAM ID	[TIGR00276] iron-sulfur cluster binding protein, putative

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00348974
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGTTAC AACAGGAAGA GATCATCAAA AAAGCGCGGG AACTGGGGTT TGCCGACATC 
GGTTTTACCA CGGCCGACCC TTTTGAGGAG CACCGACGAA TGCTGCTGGA ACGGCAGGAG 
GAGTACGGAT GGGCCGAGCA GGTAGGCCTT GACCTGCTGA AAGGCACTGA TCCCGACGCC 
ATCCTGCCGG GGGCAAAAAG CATCATCGTT CTGATCGAAA ACTATTTTTC CCACGCCTAT 
CCCCGTTCCA TGGAGGGCAT TTTCGGCCGG TGCTACCTGG ATGACGACCG GGTCACAAAA 
GACGGCCTGG TGCCGCGGAT AAAGGCCTTC CGCGCCTTTC TGCGGGAGGA CGGCATCAAC 
ACCAAGGTGC CCTTTAACCT GCCCCACCGG GTGGCCGCGG CCCGGGCCGG ACTGGGCGAT 
TTCGGCAGGA ACTGCCTCTT TTACGCTCAC AATGCCGTGC GCGGCGGCTC CTGGACCCTG 
CCCATCGCCG TGGTGGTGGA TCGAGAATTT ACGCCGGGCA CGCCCACCCT GGGCATCGGA 
TGCCCGGACT GGTGCAAGAA CGTCTGTATT GCCGCCTGCC CCACCGGCGC GCTCAAGGGC 
AGTGGCAGAA TCGATCCCCG CAAATGCATC TCATTTCTCT CCTATTTCGG CGACGGCATC 
ACGCCCCTCA AAATGAGGGA ACCCATGGGT ATGTTTGTCT ACGGGTGCGA CCGGTGCCAG 
AATGTCTGCC CCCGCAACCA GCCCTGGCTG GCCCAGGCGC TGCCGGTAAA CGAACGGGCC 
GCGGCCAAGG CGGAAAACTT CGACCTGCGG GCCCTGCTGC ACATGGACAC CGCTTATTTT 
GAAAGCAGTG TATGGCCCCA CATGTTCTAC ATGTCATCCG CCGACATCTG GCGATGGAAG 
ATGAACGTGG CCCGGGCCAT GGGCAACAGC CGGGACCAGG GCTTTGTTCC GGACCTGGCA 
CGGGCGTTTG AAGAAAACGA GGACCCCCGC GTCAAGGGAA TGGCGGCCTG GGCACTGGGC 
CACATCGGCG GCGATCAGGC CAAAACGGCC CTGGAAAAGT TTTCCGAAAC AACACTTGCC 
GGTCCCGTGG CCGAAGAGGT TCGTCTGGCA ATGGATGCCT GCGCCTGA

Protein sequence

MMLQQEEIIK KARELGFADI GFTTADPFEE HRRMLLERQE EYGWAEQVGL DLLKGTDPDA 
ILPGAKSIIV LIENYFSHAY PRSMEGIFGR CYLDDDRVTK DGLVPRIKAF RAFLREDGIN 
TKVPFNLPHR VAAARAGLGD FGRNCLFYAH NAVRGGSWTL PIAVVVDREF TPGTPTLGIG 
CPDWCKNVCI AACPTGALKG SGRIDPRKCI SFLSYFGDGI TPLKMREPMG MFVYGCDRCQ 
NVCPRNQPWL AQALPVNERA AAKAENFDLR ALLHMDTAYF ESSVWPHMFY MSSADIWRWK 
MNVARAMGNS RDQGFVPDLA RAFEENEDPR VKGMAAWALG HIGGDQAKTA LEKFSETTLA 
GPVAEEVRLA MDACA