Gene Dole_0859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0859
Symbol
ID	5693694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1007945
End bp	1009129
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	58%
IMG OID	641263456
Product	CBS domain-containing protein
Protein accession	YP_001528746
Protein GI	158520876
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000318514
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAATCGA TAGTCAAAAA ATCCGGATGG ATCGCGGCAT GCCTTCTGCT GCCGGTGGTT 
GCCGCCGGCG GCGGCGTGAC AGAGACAGCA CCTGCCGGCA GTTCCGGTGG AACAGACGCC 
GCTGCCTGGC TGGTGGTCTA TGTGGTGATG GCCCTGGGGT TCTCTTTTCT CTGCTCCGTG 
GCCGAGGCGG TGCTGCTGAG CATCACCCCC TCCTACATAG AGGGGCTGAA AGACAGGCAG 
CCAGTTCTGG CGGCCCGGTT AAAACGTCTG AAACAGGACA ACGTTGACCG GTCCCTTTCG 
GCCATCCTGA CCCTCAACAC CATTGCCCAT ACCGTAGGCG CCATCGGCGC CGGCGCCCAG 
GCGACCATTC TGTTCGGCAG CACATGGTTC GGCCTCTTTT CAGCCGCCAT GACCCTGGCA 
ATCCTTTTTC TCTCCGAGAT TGTGCCCAAA ACCATCGGCG CCGTCTACTG GACAAAACTG 
ACAGGCCCCA CCGCGCTGTT CGTCAAGACC CTTATTACGA TCCTGTACCC CATCGTATGG 
CTCTCGGAAA AAATGACAAA ATTTATCGCC CATGGAAAAG CCCTGCCGGT TTTTAACAAG 
GACGAACTGA TCGCCATGGC CCGGGCCGGG GCCGCGGCCG GCCAGATTCG CGGCAAGGAG 
TCCAAAATCA TTCAGAACCT GTTCCGGTTC GAATCCCTGA AGGTCACCGA TATCATGACC 
CCCCGCTCCG TGATCTCGGC CCTTTCCGAA ACCATGACGA TCAATGACGC ATTGCAGCAG 
ATTACCCGAA CGCCCTTCTC CCGCCTGCCC CTCTACAGAA GCCACATTGA CGACATCACC 
GGTTTTGTGC TCAAGGACGA CGTGCTGATC TTTGCCGCTC AAAAACGGAG CAGTGAGCGG 
CTCAAGGCCC TGAAACGTAA AATCGTGGTT GTTCCGGAGT CTTTGTCCCT GGCCGCTTTG 
CTGGAACGCC TGCTCAAGGA GCGGCAGCAC ATCGCCATTG TTGTCAATGA ACACGGCGGC 
ACAGACGGTC TGGTGACCCT GGAAGACCTG ATCGAGACCC TCATGGGCAT GGAGATCGTG 
GATGAAACCG ACGACGTGGT GGACATGCGG GCACTGGCCC GCAGCCGCTG GGTAAAACGC 
GCCAAGGCCA TGGGACTTGA CGCTGACTTA AAGGACCAGA CCTGA

Protein sequence

MKSIVKKSGW IAACLLLPVV AAGGGVTETA PAGSSGGTDA AAWLVVYVVM ALGFSFLCSV 
AEAVLLSITP SYIEGLKDRQ PVLAARLKRL KQDNVDRSLS AILTLNTIAH TVGAIGAGAQ 
ATILFGSTWF GLFSAAMTLA ILFLSEIVPK TIGAVYWTKL TGPTALFVKT LITILYPIVW 
LSEKMTKFIA HGKALPVFNK DELIAMARAG AAAGQIRGKE SKIIQNLFRF ESLKVTDIMT 
PRSVISALSE TMTINDALQQ ITRTPFSRLP LYRSHIDDIT GFVLKDDVLI FAAQKRSSER 
LKALKRKIVV VPESLSLAAL LERLLKERQH IAIVVNEHGG TDGLVTLEDL IETLMGMEIV 
DETDDVVDMR ALARSRWVKR AKAMGLDADL KDQT