Gene Dtox_3814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3814
Symbol
ID	8430828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	3996787
End bp	3997878
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	42%
IMG OID	645036042
Product	transposase, IS605 OrfB family
Protein accession	YP_003193141
Protein GI	258516919
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000135622
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCAAATTG TCTACCGTTT TGAAATGCGT CCGACCAAAG AGCAACAGAA AAAAATGTTT 
CACACACTAA AACTTTGCCG GAAACTCTAT AACCGGTCTT TATCTGAGCG TCAGCGTGTG 
TATAAAGAAA CCGGCCAAGG GTTGACATAT AATAAACAGC AGAATATGCT GCCGGGCTAT 
ACAAAAGAAC ATCTGGAATA CAAGCAAGTT CACAGTCAGG TAATGCAGGA TACTTTGCGC 
CGGGTAGACT TTGCCTATCA GCGGTTTTTT GCCAAAGAAG CTGGATACCC CCGGTTCAAA 
AACCGTGACC ATTACACATC ATTTACCTAT CCGCAGGTGG ATGCTGTAAA GAAAACTTTC 
TCTAAGCCGG GTAAAATCTA TCTTTCTAAA ATAGGTTTCG TAAAAATGAC AACTCACCGG 
GAATTTGATG CCAGTCAAAT ATCCAGGCTT AACATAAAGT ATTACAGTGG TAAGTGGTAC 
GCTAATTTGA CAGCCGAAGT GGAAGTACCC GAAAATCTTA CTGACAGAAC CAAATCCACC 
GGAATAGACA TGGGTCTTGA GCATTTTGCC GTACTGTCTG ACAGTACAGA GATAGAAACC 
CCAAAGTACT ATCTTAAATC GGAAAAGAAG TTAGCTAAAC AACAGCGCAG ACTCTCCCGC 
AAAAAGAAAG GTTCTAACAA CCGAGGGAAA GCCAAAACTA AGGTTGCCAA ACTTCATGCC 
AAGATAACTA ATCAACGAAA AGACTTTTTG CATAAGACAA GTTTTGAGAT AGTTCAAAGC 
CATGACATTA TTATCATGGA AGATCTGCGA ATCAAAAATA TGGTCAAAAA CCACCGTCTA 
GCTAAAAGCA TACATGATGC TTCATGGGGT ACATTCAGAA ACTTTATTGA GTATAAATGT 
CACAGATACG GTAAAATATT TCTTCCTGTC CCTCCTCATG GCACTTCCCA GACATGTCTT 
TGTGGTGCCA ATGTGCCAAA GGATTTGAGT GTCAGAGTGC ACCGGTGTCC TGCTTGTGGA 
ATGGTTATGC CCAGGGATTT GGTGTCAGCC ATATTGATAG AACGTCGTGG CTTAGAAATG 
CTAGCGGCTT AG

Protein sequence

MQIVYRFEMR PTKEQQKKMF HTLKLCRKLY NRSLSERQRV YKETGQGLTY NKQQNMLPGY 
TKEHLEYKQV HSQVMQDTLR RVDFAYQRFF AKEAGYPRFK NRDHYTSFTY PQVDAVKKTF 
SKPGKIYLSK IGFVKMTTHR EFDASQISRL NIKYYSGKWY ANLTAEVEVP ENLTDRTKST 
GIDMGLEHFA VLSDSTEIET PKYYLKSEKK LAKQQRRLSR KKKGSNNRGK AKTKVAKLHA 
KITNQRKDFL HKTSFEIVQS HDIIIMEDLR IKNMVKNHRL AKSIHDASWG TFRNFIEYKC 
HRYGKIFLPV PPHGTSQTCL CGANVPKDLS VRVHRCPACG MVMPRDLVSA ILIERRGLEM 
LAA