Gene Dole_3091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3091
Symbol
ID	5695951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3704359
End bp	3705375
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	50%
IMG OID	641265708
Product	transposase IS4 family protein
Protein accession	YP_001530971
Protein GI	158523101
COG category	[L] Replication, recombination and repair
COG ID	[COG3039] Transposase and inactivated derivatives, IS5 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCAGA CCGGATTTTT TGACTGGCAT GAGAGATTTG AGAAACTCGA CAGAAACGGC 
GATCCACTGC TTAAATTGAA TCAAGTGGTG GATTGGGAGA TGTTCCGCCA GCCTCTGGAA 
AAAATTCGTC ATAAAGAGCG AAAAAGCAAT GCCGGCGCAA GGCCCTACGA TGTAATACGG 
ATGTTCAAGA TTCTCATTAT TCAGTCGTTG TACAATCTTT CCGATGACCG GATTGAGTTT 
CAGATTCTGG ACCGGATATC GTTCATGCGC TTTCTGGGTT TGGGCCTTGG AGATCGGGTG 
CCGGACGCCA AGACCATTTG GTTGTTTCGG GAGCAGATTA CCGAAGCTGG TTTGATCAAA 
CCGTTGTTTG AGAAGTTTGA CGTCTGTTTG CGGGAAAATG GTTTTCTGGC GCAAAAAGGG 
CAGATTATTG ACGCCAGTAT TGTAGCGGCC CCTCGTCAAC GGAACAGCCG GGAAGAAAAC 
GAGCGAATCA AACGGGGAGA TATTCCCGAG GAATGGAAAG AGGCCAAGAG ACGTCAGAAA 
GACACGGATG CCCGGTGGAC AAAGAAGAAC GGACAGAACT ACTACGGATA CAAAAACCAT 
ATAAGCGTGG ACGTTAAGCA CAAGCTGATT CGGGATTATG AGGTTACGGA TGCGGCGGTT 
CATGACAGCC AGGTGTTTGA CCAGATAATT GATGAGAGCA ACAGCAGTCG TGATGTGTAT 
GCGGACTCGG CATATCGTTC GGAGGAATCG GTGAAGCGCC TCAAGGAAGA GGGTTTTCGG 
GAGCATCTGC AGCGGAAGGG ATGTCGACAC CGAAAGCTGA CGAAGCGGGA GCAACGGGGC 
AACCATACAC GGGCAAAGAC GAGATCGCGA GTCGAACATG TTTTTGGAGT GCAGGCGATG 
ATGGCCGGAG AAATGATTCT CCGGACGATC GGAATTGTTC GAGCCAGGGC CAAAATCGGA 
TTGAGGAATC TGGCGTACAA CATAAACCGA TACAGTATAC TGGGGGCAAC GGGGTAA

Protein sequence

MMQTGFFDWH ERFEKLDRNG DPLLKLNQVV DWEMFRQPLE KIRHKERKSN AGARPYDVIR 
MFKILIIQSL YNLSDDRIEF QILDRISFMR FLGLGLGDRV PDAKTIWLFR EQITEAGLIK 
PLFEKFDVCL RENGFLAQKG QIIDASIVAA PRQRNSREEN ERIKRGDIPE EWKEAKRRQK 
DTDARWTKKN GQNYYGYKNH ISVDVKHKLI RDYEVTDAAV HDSQVFDQII DESNSSRDVY 
ADSAYRSEES VKRLKEEGFR EHLQRKGCRH RKLTKREQRG NHTRAKTRSR VEHVFGVQAM 
MAGEMILRTI GIVRARAKIG LRNLAYNINR YSILGATG