Gene Dole_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3066
Symbol
ID	5695926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3674489
End bp	3675877
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	61%
IMG OID	641265683
Product	hypothetical protein
Protein accession	YP_001530946
Protein GI	158523076
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG1090] Predicted nucleoside-diphosphate sugar epimerase [COG4276] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01777] conserved hypothetical protein TIGR01777

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000836111
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACCG ACACCTTCAC ACGGCAGTCG ATCATTGATG CCGACGCGCG CACTCTGTTT 
TTATGGCATG CCCGGCCTGG CGCCATTGAA CGGCTCAGCC CGCCCTGGGA CCCCCTGGAG 
GTGATCTTTC GCACCGGCGG CATTACTGTC GGCGCCCGGG TGGTACTGAA GATGTTTGCC 
GGCCCGGTGC CCTACCGGTG GCACGCCCGG CATACCGTGT ATGAAGAAAA CCAAAAATTC 
GTGGACGAGC AGGTCAAAGG GCCCATGGCC TTCTGGCGTC ACACCCACGC CTTTGAGCCG 
GCCGGAGAAA ACCAATGCCG GCTCATCGAC ACCATTGATT ATCGCCTGCC GCTTTATCCC 
CTTACCCGTT TTCCCGGCAA GCTCCTGGTG GAGAACAAAC TTGCCCGCAT CTTTGCCTGG 
CGTCACCGGA TCACCGCCTT TGACATGGCC CTGCACCGGC GGTTTAACAA AAAGGGGCCC 
ATGACCGTGC TGATCTCCGG GGCCAGCGGA GTCCTGGCAT CAGCCCTGAT CCCCCTGCTC 
ACCACCGGTG GCCACAGGGT GGTCAGGCTG GTGCGCCGCA AACCGTCGGC CGAAAACGAG 
GTGTTCTGGA ACCCGGCCGA CAATGTCATT GACACTGATG CCTTGAAAAA CCATACCATT 
GACGCGGTGA TTCACCTGGC CGGCGAGCAT GTGGGCACCG GACGGTGGAC GGACGCCAAG 
AAAAAAACCA TTATCGACAG CCGGCAGCAG GGCACCCGTC TTCTGGCCGA AACTGCGGCC 
CGGCTCTCCC CCAGGCCCGG GGTTTTTCTC TGCGCCTCGG CCACCGGATT TTACGGTGAA 
CGGGGAGAGG CCGTGCTGAC GGAAAATGAC GGGCCGGGAA ACGATTTTCT GGCAAAGGTG 
TGCAAAATAT GGGAAGCCTC GGTCCAGCCG GCAACGGACG CCGGCATTCG CACCGTTCGC 
ATGCGCATCG GTGTGGTGCT TACACCAAAA GGCGGGGCCC TGCAGCGGCT GCTTCTGCCC 
TTTCAGCTCG GCATGGGTGG CCGCCTGGGA AACGGCCGCC AGTATTTAAG CTGGATCGGT 
ATTGATGACG CCATCGGCGC CATCTTTTAC CTGCTGATGA ATGAGACGGT CAGCGGGCCG 
GTCAACGTGG TATCCCCTTC CCCGGTCACC AACGCCGAAT TTACCCGGAC CCTGGCAACG 
GTGCTTTGCC GTCCGGCCTT GATGCCGGTG CCGGCAACGG CCATTGACCT TGCCTTTGGC 
GAAATGGGTA CCACCGTGCT GCTCACCAGC ACCCGGGTGG CGCCGTCAAA ACTGACAGAA 
TCCGGCTACT GTTTCGGCTG GCCCGATCTT GAAAGCGCAC TGCGCCACAT TCTGGGAAAG 
ACACGTTAA

Protein sequence

MITDTFTRQS IIDADARTLF LWHARPGAIE RLSPPWDPLE VIFRTGGITV GARVVLKMFA 
GPVPYRWHAR HTVYEENQKF VDEQVKGPMA FWRHTHAFEP AGENQCRLID TIDYRLPLYP 
LTRFPGKLLV ENKLARIFAW RHRITAFDMA LHRRFNKKGP MTVLISGASG VLASALIPLL 
TTGGHRVVRL VRRKPSAENE VFWNPADNVI DTDALKNHTI DAVIHLAGEH VGTGRWTDAK 
KKTIIDSRQQ GTRLLAETAA RLSPRPGVFL CASATGFYGE RGEAVLTEND GPGNDFLAKV 
CKIWEASVQP ATDAGIRTVR MRIGVVLTPK GGALQRLLLP FQLGMGGRLG NGRQYLSWIG 
IDDAIGAIFY LLMNETVSGP VNVVSPSPVT NAEFTRTLAT VLCRPALMPV PATAIDLAFG 
EMGTTVLLTS TRVAPSKLTE SGYCFGWPDL ESALRHILGK TR