Gene Dole_0103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0103
Symbol
ID	5692918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	115053
End bp	116078
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	641262680
Product	single-stranded nucleic acid binding R3H domain-containing protein
Protein accession	YP_001527990
Protein GI	158520120
COG category	[R] General function prediction only
COG ID	[COG1847] Predicted RNA-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACA CAAAAGAGTT TGAAGGCAAA AATATTGACG CGGCCCTGGA AAAGGCCAGC 
AGCGCCCTTA ACATGACCAA AGACCAGTTG CGCTACGAGG TGGTCTGTAC CGGGTCCAGC 
GGCATTTTCG GGCTGGTGGG GGTTAAAAAC GCCCGCATTC GAATTCTCAA TTCGAAAAAA 
GGGTCGGGGG GCGCCGGAGC AGGGGGCAGG CGGGACGTGC TGGACGAGGA CCGGCAGGAG 
ATTCTCTCCA TGCTGGACGA GGCTTTTGCC GAACCGGCCC CTGAACCCGA AAGCCGGCCC 
AGGCCCGAGG CTAAAGCAGC GCCCAGGGGA GAGCCCAGGG CTGAGTCGAA AAAAGCGCCC 
AGGGCCAAAC CCAAATCCCG GCCCCGGACG GAAAAAGGGG CTCCTGCCCC GGCTGAACGG 
TCAAGGGCGG CCGGCCGGCC GCCGGCAAAC GGGGCCAAGC CCCCTGCACC GGAGGAGCGC 
CCAGAGACAC CGCCGGCCGC TTCAGAGGAA CTGCCGGAAT CGCCGCCGGC ACCGCCTGTT 
GAGGTGAAAG AGGCGGACGT GGTTCTGGCC CGGGACGTTT TGAGTAAAAT ACTGGACAAC 
ATCACCGACG AAGCCACGGT GAAAGTGGCG TTCGAGCCGG GCCGGGTCGG TTTTTCCATG 
GAGGGCGGCA ACTCATCGGT GCTCATCGGC AAGCGCGGCA AAACCCTGAA GGCCATGCAG 
CATATTGTTG AAAAGGTGGT TAAAAAATCG ATGGGTGAGG CGGTGGAGGT GCAGGTGGAC 
GTGGAAGGGT ATCTGGAAAA ACGGGCATCC TCCCTGACAA CCCTTGCCTC CCGTCTGGCT 
GAAAAGGCCC GGCAGACCGG CAAGCCCACC ACCATCAGCC GAATGGACGC CTACGAGCGG 
AAGATCATTC ATGACGCCCT GCGGACCGAC AGAAGCGTGA AAACCCGCAG CGTGGGAAAC 
GGGGACATTC GAAACGTGGT GATCCATCCC GGACGGCGGA CCAGCCGTAA AAAAACGGCG 
CCATAA

Protein sequence

MTDTKEFEGK NIDAALEKAS SALNMTKDQL RYEVVCTGSS GIFGLVGVKN ARIRILNSKK 
GSGGAGAGGR RDVLDEDRQE ILSMLDEAFA EPAPEPESRP RPEAKAAPRG EPRAESKKAP 
RAKPKSRPRT EKGAPAPAER SRAAGRPPAN GAKPPAPEER PETPPAASEE LPESPPAPPV 
EVKEADVVLA RDVLSKILDN ITDEATVKVA FEPGRVGFSM EGGNSSVLIG KRGKTLKAMQ 
HIVEKVVKKS MGEAVEVQVD VEGYLEKRAS SLTTLASRLA EKARQTGKPT TISRMDAYER 
KIIHDALRTD RSVKTRSVGN GDIRNVVIHP GRRTSRKKTA P