Gene Dret_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1174
Symbol
ID	8419002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1378164
End bp	1379390
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	52%
IMG OID	645037749
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003198040
Protein GI	258405298
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000815795
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTGT CCCAGTTAAC CAAATTGACG CTGGATATTC AAGGATTTCG TGTCGGTCGG 
GTTCAGGGTG ATACGAGCGG GATCACCGTA GATATAGCCC CAGACCGGCG TCATCTGCTC 
TTTTGCAGCC GCTGCGGTAG CGCTGCCAAG TATCGGGATA CCCTTACAAG TCGCTATTTT 
CGCCATGTCC CTCTTTGGGG GATCCCTGTA TGGCTCCGGT ACAGCCCCCG CAGAGTTCGG 
TGCGGACATT GTGGCGTCAA GGTGGAGTAT TTCCCCTGGA GCACAGGCAA ACATCGGTTC 
ACAACGGCTT TTGCCCACTT CCTGGCTTCG TGGGCCCGGT TACTGCCCTG GAAACATGTA 
GCACAGCTTT TTGGTTGCTC CTGGGGTACC GTGGCCGCTG CTGTTGACCA GATTGTCGAG 
TATGGTCTGG CCCATCAAGA TCTCTCGAAT CTGACGCACA TTGGGATTGA CGAAATCTCC 
CGAGAAAAGG GCCAAGTATA CCTAACCAAT GTCTACGACC TGAATACCTC CAGACTCGTA 
TGGAGCGGGG AAAAACGGAC AAAGGCAACA ATTACCAACT TCTTCACCTC GCTTGGCCCT 
AGCAAGATCG ATAAGCTTGA AGGGGTCTGT TGCGACATGT GGGAGCCGTA TACCCAGGTC 
ATTCAAGACA AGGCCCCGAA AGCGACGATG GTCTTCGACA AATTCCACAT TGTCCGGCAT 
CTCAATGAAG CCGTTGACCA GGTCCGTAGA GACGAGATCC GGGAGAAGGG CCAAAAGCAC 
AAGGATCTGG TTAAAGACAC CCGATATATC TGGCTCAAGA ACCCGTGGAA CCTGACTGAC 
AAGCAGGCAT CTCGGTTGAA TGCACTGGAA AAACTCAATC TCAAAATCAA CAGGGCGTAT 
TTACTCAAGG AATCATTTCG CCAGTTCTGG TCGTATGAGT GCAGGACTTC AGCCAAAGAT 
TTCCTCGACA AGTGGTTCTG GTGGGCGACG CATTCCAGGC TGAAGCCAAT GCGAAATTTT 
GCTTGGATGC TGCGCCGCAA AGAAGAAAAT ATTCTCAGTT ATTTCGATAT GCCCATCAGC 
AATGGCTCGG TGGAAGGCCT CAACAATAAG GCTAAAGTCA TTAGTCACAG AGCATACGGG 
TTCAGGTCGG CCAAGAACTA CATCCGGAAT CTGTACCATT GCATGGGCGG GCTACCTGAA 
CCCCAAATTA TGCACAGATT TGTGTGA

Protein sequence

MLVSQLTKLT LDIQGFRVGR VQGDTSGITV DIAPDRRHLL FCSRCGSAAK YRDTLTSRYF 
RHVPLWGIPV WLRYSPRRVR CGHCGVKVEY FPWSTGKHRF TTAFAHFLAS WARLLPWKHV 
AQLFGCSWGT VAAAVDQIVE YGLAHQDLSN LTHIGIDEIS REKGQVYLTN VYDLNTSRLV 
WSGEKRTKAT ITNFFTSLGP SKIDKLEGVC CDMWEPYTQV IQDKAPKATM VFDKFHIVRH 
LNEAVDQVRR DEIREKGQKH KDLVKDTRYI WLKNPWNLTD KQASRLNALE KLNLKINRAY 
LLKESFRQFW SYECRTSAKD FLDKWFWWAT HSRLKPMRNF AWMLRRKEEN ILSYFDMPIS 
NGSVEGLNNK AKVISHRAYG FRSAKNYIRN LYHCMGGLPE PQIMHRFV