Gene Dole_2457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2457
Symbol
ID	5695306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2971868
End bp	2972884
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	50%
IMG OID	641265064
Product	transposase IS4 family protein
Protein accession	YP_001530338
Protein GI	158522468
COG category	[L] Replication, recombination and repair
COG ID	[COG3039] Transposase and inactivated derivatives, IS5 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000063174
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGCAGA CCGGATTTTT TGACTGGCAT GAGAGATTTG AGAAACTCGA CAGAAACGGC 
GATCCACTGC TTAAATTGAA TCAAGTGGTG GATTGGGAGA TGTTCCGCCA GCCTCTGGAA 
AAAATTCGTC ATAAAGAGCG AAAAAGCAAT GCCGGCGCAA GGCCCTACGA TGTAATACGG 
ATGTTCAAGA TTCTCATTAT TCAGTCGTTG TACAATCTTT CCGATGACCG GATTGAGTTT 
CAGATTCTGG ACCGGATATC GTTCATGCGC TTTCTGGGTT TGGGCCTTGG AGATCGGGTG 
CCGGACGCCA AGACCATTTG GTTGTTTCGG GAGCAGATTA CCGAAGCTGG TTTGATCAAA 
CCGTTGTTTG AGAAGTTTGA CGTCTGTTTG CGGGAAAATG GTTTTCTGGC GCAAAAAGGG 
CAGATTATTG ACGCCAGTAT TGTAGCGGCC CCTCGTCAAC GGAACAGCCG GGAAGAAAAC 
GAGCGAATCA AACGGGGAGA TATTCCCGAG GAATGGAAAG AGGCCAAGAG ACGTCAGAAA 
GACACGGATG CCCGGTGGAC AAAGAAGAAC GGACAGAACT ACTACGGATA CAAAAACCAT 
ATAAGCGTGG ACGTTAAGCA CAAGCTGATT CGGGATTATG AGGTTACGGA TGCGGCGGTT 
CATGACAGCC AGGTGTTTGA CCAGATAATT GATGAGAGCA ACAGCAGTCG TGATGTGTAT 
GCGGACTCGG CATATCGTTC GGAGGAATCG GTGAAGCGCC TCAAGGAAGA GGGTTTTCGG 
GAGCATCTGC AGCGGAAGGG ATGTCGACAC CGAAAGCTGA CGAAGCGGGA GCAACGGGGC 
AACCATACAC GGGCAAAGAC GAGATCGCGA GTCGAACATG TTTTTGGAGT GCAGGCGATG 
ATGGCCGGAG AAATGATTCT CCGGACGATC GGAATTGTTC GAGCCAGGGC CAAAATCGGA 
TTGAGGAATC TGGCGTACAA CATAAACCGA TACAGTATAC TGGGGGCAAC GGGGTAA

Protein sequence

MMQTGFFDWH ERFEKLDRNG DPLLKLNQVV DWEMFRQPLE KIRHKERKSN AGARPYDVIR 
MFKILIIQSL YNLSDDRIEF QILDRISFMR FLGLGLGDRV PDAKTIWLFR EQITEAGLIK 
PLFEKFDVCL RENGFLAQKG QIIDASIVAA PRQRNSREEN ERIKRGDIPE EWKEAKRRQK 
DTDARWTKKN GQNYYGYKNH ISVDVKHKLI RDYEVTDAAV HDSQVFDQII DESNSSRDVY 
ADSAYRSEES VKRLKEEGFR EHLQRKGCRH RKLTKREQRG NHTRAKTRSR VEHVFGVQAM 
MAGEMILRTI GIVRARAKIG LRNLAYNINR YSILGATG