Gene Dshi_3759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3759
Symbol
ID	5714288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009955
Strand	+
Start bp	162514
End bp	163542
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	60%
IMG OID	641276674
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001541970
Protein GI	159046298
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.076485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.271017
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTGT TTGTCGGATT GGATGTGTCG CTTGCGAAGA CTTCGGTCTG CGTGATCAGC 
GAGTACGGCA AGATTATCAA AGAGGCAGAG ACTGAAAGCG AACCCGAGGT TCTGGCGCGC 
TGGCTGCATG ATCTGGACGG CAGCATCGCG GCGATTGGCC TGGAGGCTGG GCCTCTGTCG 
CAATGGCTGC ACCGAGGGCT GACCGAAGCT GGCCTTGATA CGGTGCTCAT GGAAACGCGC 
CAAGTGAAAG GAGCGCTGAA GGCGATGCCG ATCAAGACGG ATCGGCGCGA TGCAGAAGGG 
ATTGCACGCC TTCTTCATCT CGGCTGGTTC CGCCCGGTCC ACTGTAAATC CGTGTCTGCT 
CAGGAAACCC GGGCGGTTCT TGGCGCTCGA AAGGCTATCC AGCAGAACAT GATCGCTCTG 
GAAATGTCGT TGCGCGGACT CCTGCGGAAC TTTGGCCTCA AGGTCGGCGC GATCTCCCGT 
GGCAGGTTTG AGACACGCAT TCGGGAGTTG GCAGATGGCA ACCCGATGCT GGAAACCGCG 
ACAGACCCGA TGCTGCGGGC CCGGGCGACC CTACGGCAGG AACTGGCCGG GCTCGAAGAA 
CGCGTGCGCC AGTTGGCCTG GGATGATCAG GTTTGCCAAC GGCTTATGTC GATGCCTGGA 
ATCGGTGCGG TCGTAGCACT TACATTCCGT GCTGCGGTCG ATGATCCTGC CCGCTTTCGG 
TCTTCAAAGA GAATTGGCCC CTGGGTTGGC CTGACGCCCT CACGCAACCA GTCCGGTGAA 
CGAGACGTGT CAGGCGGCAT CACCAAGGCT GGTGACGTCA ATCTGAGGCG AACATTGTGC 
CAGGCAGCAA CCGTCATGAT GAATCGCGGC CGATCGACAT GGCTGAGAAC ATGGGGAGCC 
CAGCTCGCGC AGCGGCGTGG TCGCAAAATC GCGATGGTCG CCCTCGCACG CCGCATCGCT 
GTCATCCTCC ATCGGATTTG GGTCGATGGC ACAACCTTCC AGCCAGATGC CGCGCCGAAC 
CTTGCCTGA

Protein sequence

MKLFVGLDVS LAKTSVCVIS EYGKIIKEAE TESEPEVLAR WLHDLDGSIA AIGLEAGPLS 
QWLHRGLTEA GLDTVLMETR QVKGALKAMP IKTDRRDAEG IARLLHLGWF RPVHCKSVSA 
QETRAVLGAR KAIQQNMIAL EMSLRGLLRN FGLKVGAISR GRFETRIREL ADGNPMLETA 
TDPMLRARAT LRQELAGLEE RVRQLAWDDQ VCQRLMSMPG IGAVVALTFR AAVDDPARFR 
SSKRIGPWVG LTPSRNQSGE RDVSGGITKA GDVNLRRTLC QAATVMMNRG RSTWLRTWGA 
QLAQRRGRKI AMVALARRIA VILHRIWVDG TTFQPDAAPN LA