Gene Dret_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1501
Symbol
ID	8419330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1740285
End bp	1741784
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	56%
IMG OID	645038075
Product	IstA2
Protein accession	YP_003198365
Protein GI	258405623
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0307163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.000409094
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTGAAGG TGGAACAATT TGAATTTATC CGTACCAGCT ATCGTGTCTA TGGTCTGTCC 
ATATCTGAAA TCGCCCGGAA AACCGGGCAC TCACGAAACA CGATACGCAA GGTCCTACGC 
AACGAGCACA GCGGCTATGC CGCCAGGAAG CAGCAACCGA TGCCGGCATT AGAGGGCTTT 
GCGGGGGCCA TCGATTCTTG GCTTGAGCAG GACAAGCAAA GGCCCCCAAA GCAGCGGCAT 
ACCGCGAGGC GGATCTTTCG CCGGCTGGTC CATGAGCACG GTTTCCAAGG CTCAGAGCCG 
GCAGTACGGC GCTATGTGCG CCAAGCAAAA ACTCGAATCG GTCTTGGGGC AAAGGGGGCT 
TTTGTCCCCG CAGAGCCGGA CGCGGGCCTG GAAGCCGAAG TGGACTGGGG CGATTTCAAA 
GCCTACATCG CCGGAAAACT GACCCCGCTC AAGCTCTTCT GCATGCGCTC CAAGTATTCC 
AGCACAAGCT TTGTGCGGGC CTATCCAGTC GAGCGGCAGC AGGCCCTTAT TGATGCCCAC 
ATGCAAGCTT TTGCTTTTTT CGGCGGTGTT TTCCCCACGT TGATCTATGA CAACATGACC 
GCTGCGGTCC AAAAGATTCT CAGAGGCAAA AAGCGCATTG AACAGGACGG CTTTGCCAAA 
TTCAGAGCCC ACTATACCTT TGATGCTGTC TTTTGTAATC CTAGGGCAGC GCATGAAAAA 
GGCGGTGTTG AAGGCCTCGT GGGCTACGCC CGACGTAATT TTCTCACCCC GGTGCCTGAT 
GTTGATTCTC TCCAAGAACT CAATGAGTCA CTGTTGAGCC AGTGTCTCCT CTATAAAGAG 
CAGCATATCG TCTCCGGGCA GGAATATACC GTTGGTCAGC GTTTTGAGCA TGAAAAGCAC 
CGGCTCCTGG ATCTGCCTGC TCAGCCCTAC AGCAACACCA TTTCACAGTC GGGCAAAGTA 
AACCATTATG GCACAGTCAT ATCGGACAAA AACCACTACT CCGTGCCCTC CCGGTATGCG 
GGGCTGAAAG TCCACCTGAG CCTCGGCGCG CAAAAGGTCG AGGTATTTTA CGATGGACGC 
CGCATTGCCT GCCATGACCG CGTTTACGGG AACAACAAGT GGGTGCTTGA CCCTGATCAC 
TACCTGGATC TGTTGCAAAC GCGTCCCAGC GCCTTTAGCT CGGCCAAGCC CATCAAGCAG 
TGGCGTGCTG AGTGGCCGGC AAGCTTTGAA CGGCTCCTCC AGCGCTTACG GCAAGCACAG 
GGGATAGGCA AAGGCACCAA GGACTTTATC AGTGTGCTCA AGCTCTACCG CGAGCATGCA 
TCCGAGGACG TCGAGCGGGC TGTCCAGCGC GCTCTGGAGG CGGGCGTTAG CAGCGGCGAA 
GCCGTGAGGC ACCTTCTCCG GCCACAAATC CCTGAGCCTG TTAGCGGCCC CGTTCCAGGG 
TGGAGCAGCT TTGTCCCTGC GGATATCTCA GTGTATGGCG AGCTCGGAGG TGTATCATGA

Protein sequence

MLKVEQFEFI RTSYRVYGLS ISEIARKTGH SRNTIRKVLR NEHSGYAARK QQPMPALEGF 
AGAIDSWLEQ DKQRPPKQRH TARRIFRRLV HEHGFQGSEP AVRRYVRQAK TRIGLGAKGA 
FVPAEPDAGL EAEVDWGDFK AYIAGKLTPL KLFCMRSKYS STSFVRAYPV ERQQALIDAH 
MQAFAFFGGV FPTLIYDNMT AAVQKILRGK KRIEQDGFAK FRAHYTFDAV FCNPRAAHEK 
GGVEGLVGYA RRNFLTPVPD VDSLQELNES LLSQCLLYKE QHIVSGQEYT VGQRFEHEKH 
RLLDLPAQPY SNTISQSGKV NHYGTVISDK NHYSVPSRYA GLKVHLSLGA QKVEVFYDGR 
RIACHDRVYG NNKWVLDPDH YLDLLQTRPS AFSSAKPIKQ WRAEWPASFE RLLQRLRQAQ 
GIGKGTKDFI SVLKLYREHA SEDVERAVQR ALEAGVSSGE AVRHLLRPQI PEPVSGPVPG 
WSSFVPADIS VYGELGGVS