Gene Dret_1496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1496
Symbol
ID	8419325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1733291
End bp	1734628
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	48%
IMG OID	645038070
Product	transposase IS4 family protein
Protein accession	YP_003198360
Protein GI	258405618
COG category	[L] Replication, recombination and repair
COG ID	[COG3666] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000517789
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000000823353
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTAGAG GGTTTATTAA AGGGCATCGA GATCAACTCT ACCTGTTGCC ACCTTCAATT 
GATGACTGGA TATCAAAAAA CCACAGTGTC AGGTTGATCG ATTCTTGTGT AGAAAATATT 
GATTTATCAA TTTTTTATGA AAGCTACTCC CACGAGGGGA AGCCGCCTTA TGACCCTGCT 
ATGATGATTC GTATTCTTAT TTATGCATAT AGCAAAGGAA TACGCTCTTC TCGGAAAATA 
TCTGCTTTAT GCGAAGAAGA TATTGCTTTC CGGTGGCTTA CCGGAAATAT AATTCCTGAT 
CATTCTGCTA TTTGCCGCTT CCGCGCTAAG CATAAAGAAA ATTTTAAGCA GCTTTTTCGA 
GAAACAATCC GTTTGGCCGC TGAATCCGGT GCGTTAAAAA TAGGCAGTCT TTTTCTTGAT 
GGAACTAAGG TGAAAGGCTC GGCTTCCTTG GAAGCCAATC GTAATCTCGA GCATATTAAG 
CAAGACATTG AACGCATCGT GGACGAAGCT GAGGCAGTCG ATGCCAGTGA GGATAAGCAG 
CTCGGCGAAG ATAACCGGGA CGATGTTTTG CCCCCTGAGC TTGCTGATCC CAAATCCCGG 
TTGGAGCGAC TCAAGGCTGC CAAGGCCAGG CTGGAAGCTG AAAAAGAGGC TGCGGCGAAA 
GAGTCTCGAG ATGACGACGA CTCAAATGGT CCTGGAGCTG GCACCGGTGA TGAAAAAACG 
GCCACTGGCA ACAAAGAAAA AGCAAATATC ACCGATCCTG ACAGCAGAAT AATGAAAACA 
CGGAACGGCT GGGTGCAAGG GTATAATTGC CAAGGAGTTT CAGACGAAAA TCAGTTTATA 
GTCGCCAACG CAGTTACTCA AGACTGCAAT GACGCCCACC AACTCGAACC AATGCTTCAA 
GCGGCTCAAG ACAACTTGTC CAAGATAGAG ACAGGCCAGA ACACCGAAAC CTTTTCGGCA 
GATGCCGGTT ACTGGGCTGA GGGACTTGAT ATTTCAAAGA TCGAGAGCAA TGGCCCAGAG 
GTGATTGTGG CTACCCGCAA AGGCTGGAAG CAGCGAAAAC AAAACCGTGA AAAGTCCCCA 
CCTCGAGGGC GGATCCCCAA AGGGTTATCC CAGCGGGAGT TGATGGAACG AAAGCTACTG 
ACCCAAAGAG GCCAGCGGAT CTATGCCAAG CGCGGACAAA CGATAGAAGC TATTTTCGGT 
CAACTCAAGG AATGCCTTGG ATACAGGAAT TTTCTATTGC GTAGCCTCAA AAAAGTTCAG 
GGTGAATGGG ACCTCCAATG TGCAGTGAGC AATATGCTCA AGCTGTTTCG GTTGTCAGGG 
GCCACCACCA GTCAGTAG

Protein sequence

MARGFIKGHR DQLYLLPPSI DDWISKNHSV RLIDSCVENI DLSIFYESYS HEGKPPYDPA 
MMIRILIYAY SKGIRSSRKI SALCEEDIAF RWLTGNIIPD HSAICRFRAK HKENFKQLFR 
ETIRLAAESG ALKIGSLFLD GTKVKGSASL EANRNLEHIK QDIERIVDEA EAVDASEDKQ 
LGEDNRDDVL PPELADPKSR LERLKAAKAR LEAEKEAAAK ESRDDDDSNG PGAGTGDEKT 
ATGNKEKANI TDPDSRIMKT RNGWVQGYNC QGVSDENQFI VANAVTQDCN DAHQLEPMLQ 
AAQDNLSKIE TGQNTETFSA DAGYWAEGLD ISKIESNGPE VIVATRKGWK QRKQNREKSP 
PRGRIPKGLS QRELMERKLL TQRGQRIYAK RGQTIEAIFG QLKECLGYRN FLLRSLKKVQ 
GEWDLQCAVS NMLKLFRLSG ATTSQ