Gene Dret_1002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1002
Symbol
ID	8418824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1176444
End bp	1177670
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	52%
IMG OID	645037571
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003197868
Protein GI	258405126
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.520122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0401463
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTGT CCCAGTTAAC CAAATTGACG CTGGATATTC AAGGATTTCG TGTCGGTCGG 
GTTCAGGGTG ATACGAGCGG GATCACCGTA GATATAGCCC CAGACCGGCG TCATCTGCTC 
TTTTGCAGCC GCTGCGGTAG CGCTGCCAAG TATCGGGATA CCCTTACAAG TCGCTATTTT 
CGCCATGTCC CTCTTTGGGG GATCCCTGTA TGGCTCCGGT ACAGCCCCCG CAGAGTTCGG 
TGCGGACATT GCGGCGTCAA GGTGGAGTAT TTCCCCTGGA GCACTGGCAA ACATCGGTTC 
ACAACGGCTT TTGCCCACTT CCTGGCTTCG TGGGCCCGGT TACTGCCCTG GAAACATGTA 
GCACAGCTTT TTGGTTGCTC CTGGGGTACC GTGGCCGCTG CTGTTGACCA GATTGTCGAG 
TATGGTCTGG CCCATCAAGA TCTCTCGAAT CTGACGCACA TTGGGATTGA CGAAATCTCC 
CGAGAAAAGG GCCAAGTATA CCTAACCAAT GTCTACGACC TGAATACCTC CAGACTCGTA 
TGGAGCGGGG AAAAACGGAC AAAGGCAACA ATTACCAACT TCTTCACCTC GCTTGGCCCT 
AGCAAGATCG ATAAGCTTGA AGGGGTCTGT TGCGACATGT GGGAGCCGTA TACCCAGGTC 
ATTCAAGACA AGGCCCCGAA AGCGACGATG GTCTTCGACA AATTCCACAT TGTCCGGCAT 
CTCAATGAAG CCGTTGACCA GGTCCGTAGA GACGAGATCC GGGAGAAGGG CCAAAAGCAC 
AAGGATCTGG TTAAAGACAC CCGATATATC TGGCTCAAGA ACCCGTGGAA CCTGACTGAC 
AAGCAGGCAT CTCGGTTGAG TGCACTGGAA AAACTCAATC TCAAAATCAA CAGGGCGTAT 
TTACTCAAGG AATCATTTCG CCAGTTCTGG TCGTATGAGT GCAGGACTTC AGCCAAAGAT 
TTCCTCGACA AGTGGTTCTG GTGGGCGACG CATTCCAGGC TGAAGCCAAT GCGAAATTTT 
GCTTGGATGC TGCGCCGCAA AGAAGAAAAT ATTCTCAGTT ATTTCGACAT GCCCATCAGC 
AATGGCTCGG TGGAAGGCCT CAACAATAAG GCTAAAGTCA TTAGTCACAG AGCATACGGG 
TTCAGGTCGG CCAAGAACTA CATCCGGAAT CTGTACCATT GCATGGGCGG GCTACCTGAA 
CCCCAAATTA TGCACAGATT TGTGTGA

Protein sequence

MLVSQLTKLT LDIQGFRVGR VQGDTSGITV DIAPDRRHLL FCSRCGSAAK YRDTLTSRYF 
RHVPLWGIPV WLRYSPRRVR CGHCGVKVEY FPWSTGKHRF TTAFAHFLAS WARLLPWKHV 
AQLFGCSWGT VAAAVDQIVE YGLAHQDLSN LTHIGIDEIS REKGQVYLTN VYDLNTSRLV 
WSGEKRTKAT ITNFFTSLGP SKIDKLEGVC CDMWEPYTQV IQDKAPKATM VFDKFHIVRH 
LNEAVDQVRR DEIREKGQKH KDLVKDTRYI WLKNPWNLTD KQASRLSALE KLNLKINRAY 
LLKESFRQFW SYECRTSAKD FLDKWFWWAT HSRLKPMRNF AWMLRRKEEN ILSYFDMPIS 
NGSVEGLNNK AKVISHRAYG FRSAKNYIRN LYHCMGGLPE PQIMHRFV