Gene Dole_0440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0440
Symbol
ID	5693260
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	508158
End bp	510020
Gene Length	1863 bp
Protein Length	620 aa
Translation table	11
GC content	60%
IMG OID	641263022
Product	thiamine pyrophosphate binding domain-containing protein
Protein accession	YP_001528327
Protein GI	158520457
COG category	[C] Energy production and conversion
COG ID	[COG4231] Indolepyruvate ferredoxin oxidoreductase, alpha and beta subunits
TIGRFAM ID	[TIGR03336] indolepyruvate ferredoxin oxidoreductase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000968749
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATAAAT TACTTGCCAA GGAACCGGGA AAAGAGATGC TGCTCTTGGG CAACGAGGCC 
CTGGCCCGGG GCGCCCTGGA GGCGGGTGTG GGGTTTGCCT CCACCTATCC GGGAACGCCA 
TCCTCGGAGC TGTCGCTCAA TTTTTTCCAG ATCTCCCGGG AGACCGACCT CTATTTTGAA 
TACAGCACCA ACGAAAAGGT GGCCCTGGAA GTGGCGGCCG CTGCCGCCAA CTGCGGGGTG 
CGCAGCATGT GCGTGATGAA GCACGTGGGC GTGAACGTGG CGGCCGACGC CCTGATGACC 
CTGGCCTATG TGGGCGTCAA GGCCGGCATG GTGCTGTTGT CCGCCGACGA TCCCCACATG 
TTTTCCAGCC AGAACGAGCA GGACAACCGC TATTACGGCA AGCTTTCCGG CCTGCCCGTG 
GTCGAGCCCT CCTCCGTGGC CGAGGCAAAA GAGATGGCCG TTTACGCCTT TGAAGTCTCC 
GAGGCCCTGG GCGAGCCGGT GATCCTGCGC ACCACCACCC GGGTCAACCA TTCATCGGCC 
AAGGTGGCGC TGGGCAGCCT TCCTGAAAAG GTCAAAACCG AGGGCCAATT TGAAAAGGAC 
CCGTTTAATT ACGTTACCGT GCCGGCGGTT TCCAGAAAGC TTCATGTCCG GCTGCTGGAA 
CGTCTGAAAA AGGCCGCCGA CCTGTCCAAT ACATCGCCTT ACAATATTCG CACCGGCAAG 
GGCCGATATG GCATCATTTG TAACGGGGTG AGTTATTTTT ACGTTACCGA CGCGTTAAAG 
GCCCTGGGCC GGGAGAGCGA TTTTTCCGTG CTGCGCGTCG GGTTTTCCAA CCCCATGCCC 
GACGCCCTGG TCAAGGCGTT TCTGGCCGAC TGCGACAGGG TGCTGGTGGC CGAAGAGGGT 
GAGCCCTTCA TGGAAGAGGC GGTCAAGGCC ATGGCCGCCG AGGAAAAGCG GTGCATTGAT 
ATCGCGGGCA AGCGGGAAGA CCTGTTTTCC CGGCTCTCCG AGTTTGATCC CCAGCTGGTG 
GCCCGCTGCA TTGCCCGCTA TTTTGATATT CCTTACACAC CGCCGACGCC GGCGGATATG 
TCCGGCGTGC CCGAGATTCC CCAGAGGCCC CCCAACCTGT GCGCGGGCTG CTCCCACCGG 
GCCACCTTTT ACGCGGTAAA AAAAGCCGCG GAAGGGTATG ACACGATCTT TCCCACGGAC 
ATCGGGTGCT ACACCCTGGG GTTTCTGCCG CCGCTCTCCA TGGGCGATTT TCTGATCTGC 
ATGGGATCTT CCGTGGGCAC GGCCTGCGGG TTTTCCCGGG CATCGAACCA GAAGGTGGTG 
GCCTTTATCG GGGATTCCAC CTTTTTCCAT TCCGGCATTC CGGCCCTGAT CAACGGGGTG 
TTCAACAACC ACGACTTTAC CCTGGTGATC CTGGACAACG GCACCACCGC CATGACCGGG 
CACCAGCCAC ACCCCGGCGT GGACATGGAC GAGCTCAATT TTTCCGGTTT TCAGCGGGTC 
TCCATCGAGG CACTGGTCAA AGGCGCCGGC GTTCAGCACG TGTCAGTGAT CCGGCCCTAC 
AACCTGAAAA AAAGTATTGA GGCGATTCGG GAGGCCATTG AATTCAAGGG CGTTTCCGTG 
GTCATTGCAC GGGAAGAGTG CGTGCTCAAG GCCAAAAGCC TCAAGCGGGG AAGCGCCCGG 
GTTTTTTACG TGAGCGACCG GTGCAAAAAC CACCGGGACT GCATCAACAC CCTGGCCTGC 
CCGGCTTTTT ACGTGGCGGA CGGCCGGGTG CAAATCAACC CCAATCTGTG CGCCGGGTGC 
GCGGTGTGCG TTCAGGTGTG CCCGGAGAAG GCCATTGTGC CGGTAAAACA GGATCAGAAG 
TAA

Protein sequence

MHKLLAKEPG KEMLLLGNEA LARGALEAGV GFASTYPGTP SSELSLNFFQ ISRETDLYFE 
YSTNEKVALE VAAAAANCGV RSMCVMKHVG VNVAADALMT LAYVGVKAGM VLLSADDPHM 
FSSQNEQDNR YYGKLSGLPV VEPSSVAEAK EMAVYAFEVS EALGEPVILR TTTRVNHSSA 
KVALGSLPEK VKTEGQFEKD PFNYVTVPAV SRKLHVRLLE RLKKAADLSN TSPYNIRTGK 
GRYGIICNGV SYFYVTDALK ALGRESDFSV LRVGFSNPMP DALVKAFLAD CDRVLVAEEG 
EPFMEEAVKA MAAEEKRCID IAGKREDLFS RLSEFDPQLV ARCIARYFDI PYTPPTPADM 
SGVPEIPQRP PNLCAGCSHR ATFYAVKKAA EGYDTIFPTD IGCYTLGFLP PLSMGDFLIC 
MGSSVGTACG FSRASNQKVV AFIGDSTFFH SGIPALINGV FNNHDFTLVI LDNGTTAMTG 
HQPHPGVDMD ELNFSGFQRV SIEALVKGAG VQHVSVIRPY NLKKSIEAIR EAIEFKGVSV 
VIAREECVLK AKSLKRGSAR VFYVSDRCKN HRDCINTLAC PAFYVADGRV QINPNLCAGC 
AVCVQVCPEK AIVPVKQDQK