Gene Dole_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2094
Symbol
ID	5694937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2543541
End bp	2544569
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	52%
IMG OID	641264695
Product	hypothetical protein
Protein accession	YP_001529975
Protein GI	158522105
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA CGCCTCAACA AGACAGGGAG TATACCTCTT TTATCAAGGA GATAAAAAAG 
CGGATCAATG ATTCCCGGAT AAAGGCGGCG GTCTCCGTCA ACCGGGAATT GCTGACCCTG 
TACTGGGACC TGGCCGCCCA GATTGTTAAA AAACAGCAAC AGGCTTCCTG GGGCGACGGC 
TTTTTAGACC GGATGAGCAA GGACCTGCAA GCGGAATTTC CCGATATTAA AGGCTTTTCC 
CTGCGAAACC TGAAATACAT GCGTCAGTGG TATCTGTTCT GGTCGCAGGA AGCGTCAATT 
GGGCAACAGC TTGTTGCCCA AATTCCCTGG GGGCACAACC TGGTCATTGT CAGCAAAACC 
GAAAACCCCG AAGAAGCCCT GTTTTACGTC CAGAAAACCA TGGAAAACAA CTGGTCCCGG 
GCGGTTCTGA CCCACCAGAT CGAAAGCAAT CTGTTTCAGC GCCAGGGCCG GGCTGTAACC 
AATTTTACGG CCACCCTGCC GGCCCCCCAG TCCGACCTGG CCCTGCAAAC CATTAAAGAC 
CCCTATAATT TTGATTTTCT CACCCTGCGG GAAAAACATG ATGAAAAGGA GCTGGAAAAT 
GCCCTCATGG ACCAGGTCAC CCGCTTTCTG CTGGAGCTGG GCGCCGGGTT CTCTTTTATC 
GGCCGCCAGC ACCGGCTGAC GGTGGGCGAC GAGGATTTTT ATATCGATCT GCTTTTTTAT 
CATGTCTGCC TGCACTGCTA TGTGGTGGTG GAATTAAAAG CGGTCCGGTT CAAACCGGCC 
TTTACCGGCC AGCTCAATTT TTATGTGTCT GCCGTGGACG GCCAGATGAA GACGGAACAG 
GACAATCCCA CCATCGGTAT TCTCATCTGC AAGTCAAAAA ACAAGACCGT GGTGGAATAT 
GCCTTAAAGG ACATTCACAA GCCCATCGGC GTCAGCGAAT ACATGATCAC CCGCTGCCTG 
CCCGATGAAT TCAAGTCCTC CCTGCCGAGC ATCGAAGATA TAGAAGCCGA ACTGGAGGAC 
CTTGAATGA

Protein sequence

MSKTPQQDRE YTSFIKEIKK RINDSRIKAA VSVNRELLTL YWDLAAQIVK KQQQASWGDG 
FLDRMSKDLQ AEFPDIKGFS LRNLKYMRQW YLFWSQEASI GQQLVAQIPW GHNLVIVSKT 
ENPEEALFYV QKTMENNWSR AVLTHQIESN LFQRQGRAVT NFTATLPAPQ SDLALQTIKD 
PYNFDFLTLR EKHDEKELEN ALMDQVTRFL LELGAGFSFI GRQHRLTVGD EDFYIDLLFY 
HVCLHCYVVV ELKAVRFKPA FTGQLNFYVS AVDGQMKTEQ DNPTIGILIC KSKNKTVVEY 
ALKDIHKPIG VSEYMITRCL PDEFKSSLPS IEDIEAELED LE