Gene Dshi_4092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_4092
Symbol
ID	5714644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009958
Strand	-
Start bp	24188
End bp	25219
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	66%
IMG OID	641276999
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001542295
Protein GI	159046626
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.293783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGTTGT TTGTCGGCTT GGATGTATCG CTGGAGAAGA CTGCGATCTG CGTGATCAGC 
GAGCATGGAA AGATCGTTAG GGAGGCGCAG GTCATCAGCG AGCCCGAGGC GCTCGCGCGG 
TGGATCGAAG AGCAGTCCGG CAGCATCGCT GCCGTCGGTC TCGAGGCCGG ACCACTGTCG 
CAGTGGCTGC ATCGGGGCCT CTCGGCCGCG GGCCTGGACG TGGTGCTTAT GGAAACGCGC 
CGGGTAAAGA GCGCCCTGAA GGCGATGCCG ATCAAGACGG ACCGGAGGGA TGCCGAGGGC 
ATCGCGCGTT TGCTTCACCT CGGGTGGTTC CGGCCGGTCC ATTGCAAGTC CGTCTCGGCG 
CAGGAAGTCC GCGCCCTGCT GGCGGCACGC AAAGCGGTCC AGCAGGGCAT GATCGCGCTG 
GAGATGTCTC TGCGCGGCCT GCTGCGGAAC TTCGGCCTGA AGGTGGGCGC CATCTCCCGA 
GGCCGTTTCG AACACCGCAT TCGGGAACTG GCGACAGGAA ATGCGATGCT GGAAGCGGCG 
ACCGAGCCGA TGCTGCGTGC CCGCGCCGCC CTGCGACAGG AATTGGCTGG ACTCGAGCGG 
CACGTTCGCG GATTGGCCCA AGAAGATGAA GTGTGTCAGC GCCTGATGTC CATGCCCGGT 
ATCGGCGCGG TCGTGGCGTT GACGTTCCGC TCCGCCGTGG ACGACCCGTC CCGGTTCAGT 
TCCTCAAAGA AAGTGGGCCC CTGGGCCGGC CTGACACCGT CGCGCAATCA ATCCGGCGAA 
CGCGATGTCT CAGGCGGCAT AACGAAGGCG GGCGATGCCA ATCTGCGCCG CGCCTTGTGT 
CAGGCCGCGA CCGTCATGAT GAACCGCGGC CCTTCTACAT GGCTGAGAAC CTGGGCCGAG 
CGCGTCGCCC GCCGCAGGGG CCGAAAGTGT GCCATGGTCG CGCTTGCGCG CCGCATCGCC 
GTTGTTCTTC ACCGGATGTG GCGTGACGAA ACCGCATTCC AAGCGGGGGC GCCAATCAGC 
CATGCGGCAT GA

Protein sequence

MRLFVGLDVS LEKTAICVIS EHGKIVREAQ VISEPEALAR WIEEQSGSIA AVGLEAGPLS 
QWLHRGLSAA GLDVVLMETR RVKSALKAMP IKTDRRDAEG IARLLHLGWF RPVHCKSVSA 
QEVRALLAAR KAVQQGMIAL EMSLRGLLRN FGLKVGAISR GRFEHRIREL ATGNAMLEAA 
TEPMLRARAA LRQELAGLER HVRGLAQEDE VCQRLMSMPG IGAVVALTFR SAVDDPSRFS 
SSKKVGPWAG LTPSRNQSGE RDVSGGITKA GDANLRRALC QAATVMMNRG PSTWLRTWAE 
RVARRRGRKC AMVALARRIA VVLHRMWRDE TAFQAGAPIS HAA