Gene Dole_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2121
Symbol
ID	5694964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2575505
End bp	2576485
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	60%
IMG OID	641264722
Product	radical SAM domain-containing protein
Protein accession	YP_001530002
Protein GI	158522132
COG category	[R] General function prediction only
COG ID	[COG1313] Uncharacterized Fe-S protein PflX, homolog of pyruvate formate lyase activating proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000152404
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAATGA TGATTTCAAC AAAACAGAAG CGAGTTTCAG AAATTGCTCC CGTTCTCTGG 
CAACGGCTGG AGAGTTGCGA CCTGTGCCCG CGAAAATGCG GGGTCAACCG GCTGGCCGGG 
GAAAAGGGAT TCTGCGCCCT GTCCGGTGAC TGGGTGCCGG TGTCAAGCTT CTGCGCCCAC 
CGGGGGGAAG AGCCGGTGCT CTCCGGCCGG GCCGGATCGG GCACGATATT TTTTTCCCAC 
TGCAACCTGG GGTGTCTCTT CTGCCAGAAC CACCAGATCA GCGACAACTC GCTGGATCCC 
GGCCCCTCCA TGGTTCGCAT CGATGAGCTG GCCCGAATCA TGATTGTCCT GCAGGCCATG 
GGGTGTCACA ACATCAATTT TGTCACCCCC ACCCATGTGC TGCCCCACAT TGTGGCGGCC 
ATAAAAATCG CCCTGGACCA GGGGCTTGTC CTTCCCCTGG TGTATAACTG CGGCGGATAT 
GAAAACGCGG AGGTGATCCG CCTGCTGGAC GGCGTAATGG ATATCTATCT GCCGGACTTT 
AAATACATGG ACGGCGCACT GGCCCGCACG TATTCGGCGG CCCCGGATTA TCCGGCGGCC 
GCGGCGGCCG CCTTCAAGGA AATGTACCGG CAGGCAGGGA GCGGTCTTGA CATTGACCCG 
GCCACGCAAA CGGCACGGCA CGGCATGATC ATCCGCCACC TGGTGCTACC CGGCGGTGTA 
AAAAATTCGG TCGATGTGCT GACGTGGATA GCGGACAACC TGTCGCCGAA ACTCCATCTG 
TCGCTGATGT CCCAGTACCA TCCACCGGCA GGCCCCCGAA GGCCAGAGCC GCCGCTTGAC 
CGCCCGCTTT TTCCCGAAGA GTATGGAGCG GTGTCCGCCA GGGCCGAGTC CCTGGGGTTT 
GAAAACGGCT GGTTCCAGGA AATGGAAAGC CATGACGTCT ACCGCCCCGA TTTCAAAAAG 
GCCCACCCGT TTGAGGAGTG A

Protein sequence

MEMMISTKQK RVSEIAPVLW QRLESCDLCP RKCGVNRLAG EKGFCALSGD WVPVSSFCAH 
RGEEPVLSGR AGSGTIFFSH CNLGCLFCQN HQISDNSLDP GPSMVRIDEL ARIMIVLQAM 
GCHNINFVTP THVLPHIVAA IKIALDQGLV LPLVYNCGGY ENAEVIRLLD GVMDIYLPDF 
KYMDGALART YSAAPDYPAA AAAAFKEMYR QAGSGLDIDP ATQTARHGMI IRHLVLPGGV 
KNSVDVLTWI ADNLSPKLHL SLMSQYHPPA GPRRPEPPLD RPLFPEEYGA VSARAESLGF 
ENGWFQEMES HDVYRPDFKK AHPFEE