Gene Dole_1659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1659
Symbol
ID	5694496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1972700
End bp	1973959
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	52%
IMG OID	641264254
Product	hypothetical protein
Protein accession	YP_001529540
Protein GI	158521670
COG category	[S] Function unknown
COG ID	[COG5338] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000022104
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACAGC TGTTTACGGC AGGAACGTGC CTCTTTCTGT TGCTGATCTA TGGGGCTACA 
GTACATTTAC CGGCCCATGC CGCCTCCGGC ACCATCGGCG GAGATATTTT CGGTCTTCAG 
CAGGGAGTCT TTCACACCTT CCTTAACGTC ACCGAAAAAT ACACGGACAA CCTTTACAAT 
TCCAGAACCA GCAAAGAATC AGAGCTGATC AGTATTGTTT CCCCTGGCCT GGCCCTGGCC 
CTTCCCGGCT CCGACGTGGT GGATATTAAA ATGAACACCG CCACCGGCGC CCCCGGCGGT 
CTTGCCATGT CCCGCTATAA AATGGACACC ACCCGGCGCT ACCAGGGCAT GCTGGTTTAC 
AACCCGGAAT TTGAGTTCTA TCATGACAAT TCCAGTGAAA ATTTTATCAG CCACAAGGTC 
AAGGGAGCAT TTCAATATAA AGCCCCCGGC GGGCTGACCT TTGATGTCGC CGATCATTAT 
AAATACGGAC AGGAGATGCG GGGCGAAATC GGCAACCCGG ACCCGGACAC CTATTATTCC 
AACGTGGCCC ACGCCATTGT GGAATTTGCC TTTTCCCCGA AATTCAGCAT CGGTGCCGGC 
GGTGCGTCCC ACACCATTTC CTACCGGGAA ACAAACTTCC GTGACAGAAA CGACAGGGTC 
TACTTCGGCT CCCTCAACTT CCATCCAACG GCAAAAACAC GGCTTTTCTT CGAATACAAA 
AACATTGACG TTCGCTACGA TGCCTTTCTC TCCACGGACA AAGAAAATAC AGAAGATCAA 
TATTATGCAG GTTTTGCATG GAAGATGACG GCCAAATCAC AGGGTACGTT GAAGGTCGGT 
TATATGGCCA AGGATTTTGA TACCCCCGGA ATAGACGACC CCTCGGACTG GGCCGGTGAA 
ATCGACCTGA CGCATGCAAT CACCCCGGAC ACGACCATCA TGCTGGGGGC TTCCCGAAAA 
TACCACGAAA CCAACATTGC GGCCGCCGAC TACTACACCG CCGATCGCGT CACAGCCATG 
TACAGCCAGG CATTCACCCC CAAGCTCAAG GGTGACATGA TGCTCTCTTA CGGCAAAGAC 
AACTATGAAG GTATTATCCT TGAGTGCGAC ACCTACATAA TCCGGCCCGC CCTTACCTTC 
AAGCCCCGGC GGTGGCTGTC GATTGAACTG GCCTACTCTT ACACTGAGCG TTTTGCCGAC 
CTGGCCTCCA TGGACTACAG CACCAACGAT TACACACTGA GGATAGGGGG CACTTTTTAA

Protein sequence

MRQLFTAGTC LFLLLIYGAT VHLPAHAASG TIGGDIFGLQ QGVFHTFLNV TEKYTDNLYN 
SRTSKESELI SIVSPGLALA LPGSDVVDIK MNTATGAPGG LAMSRYKMDT TRRYQGMLVY 
NPEFEFYHDN SSENFISHKV KGAFQYKAPG GLTFDVADHY KYGQEMRGEI GNPDPDTYYS 
NVAHAIVEFA FSPKFSIGAG GASHTISYRE TNFRDRNDRV YFGSLNFHPT AKTRLFFEYK 
NIDVRYDAFL STDKENTEDQ YYAGFAWKMT AKSQGTLKVG YMAKDFDTPG IDDPSDWAGE 
IDLTHAITPD TTIMLGASRK YHETNIAAAD YYTADRVTAM YSQAFTPKLK GDMMLSYGKD 
NYEGIILECD TYIIRPALTF KPRRWLSIEL AYSYTERFAD LASMDYSTND YTLRIGGTF