Gene Dret_0551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0551
Symbol
ID	8418362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	662559
End bp	663785
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	52%
IMG OID	645037118
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003197426
Protein GI	258404684
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.340213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTGT CCCAGTTAAC CAAATTGACG CTGGATATTC AAGGATTTCG TGTCGGTCGG 
GTTCAAGGTG ATACGAGCGG GATCACCGTA GATATAGCCC CAGACCGGCG TCATCTGCTC 
TTTTGCAGCC GCTGCGGCAG CGCTGCCAAG TATCGGGATA CCCTTACAAG TCGCTATTTT 
CGCCATGTCC CTCTTTGGGG GATCCCTGTA TGGCTCCGGT ACAGCCCCCG CAGAGTTCGG 
TGCGGACATT GTGGCGTCAA GGTGGAGTAT TTCCCCTGGA GCACAGGCAA ACATCGGTTC 
ACAACGGCTT TTGCCCACTT CCTGGCTTCG TGGGCCCGGT TACTGCCCTG GAAACATGTA 
GCACAGCTTT TTGGTTGCTC CTGGGGTACC GTGGCCGCTG CTGTTGACCA GATTGTCGAG 
TATGGTCTGG CCCATCAAGA TCTCTCGAAT CTGACGCACA TTGGGATTGA CGAAATCTCC 
CGAGAAAAGG GCCAAGTATA CCTAACCAAT GTCTACGACC TGAATACCTC CAGACTCGTA 
TGGAGCGGGG AAAAACGGAC AAAGGCAACA ATTACCAACT TCTTCACCTC GCTTGGCCCT 
AGCAAGATCG ATAAGCTTGA AGGGGTCTGT TGCGACATGT GGGAGCCGTA TACCCAGGTC 
ATTCAAGACA AGGCCCCGAA AGCGACGATG GTCTTCGACA AATTCCACAT TGTCCGGCAT 
CTCAATGAAG CCGTTGACCA GGTCCGTAGA GACGAGATCC GGGAGAAGGG CCAAAAGCAC 
AAGGATCTGG TTAAAGACAC CCGATATATC TGGCTCAAGA ACCCGTGGAA CCTGACTGAC 
AAGCAGGCAT CTCGGTTGAG TGCACTGGAA AAACTCAATC TCAAAATCAA CAGGGCGTAT 
TTACTCAAGG AATCATTTCG CCAGTTCTGG TCGTATGAGT GCAGGACTTC AGCCAAAGAT 
TTCCTCGACA AGTGGTTCTG GTGGGCGACG CATTCCAGGC TGAAGCCAAT GCGAAATTTT 
GCTTGGATGC TGCGCCGCAA AGAAGAAAAT ATTCTCAGTT ATTTCGACAT GCCCATCAGC 
AATGGCTCGG TGGAAGGCCT CAACAATAAG GCTAAAGTCA TTAGTCACAG AGCATACGGG 
TTCAGGTCGG CCAAGAACTA CATCCGGAAT CTGTACCATT GCATGGGCGG GCTACCTGAA 
CCCCAAATTA TGCACAGATT TGTGTGA

Protein sequence

MLVSQLTKLT LDIQGFRVGR VQGDTSGITV DIAPDRRHLL FCSRCGSAAK YRDTLTSRYF 
RHVPLWGIPV WLRYSPRRVR CGHCGVKVEY FPWSTGKHRF TTAFAHFLAS WARLLPWKHV 
AQLFGCSWGT VAAAVDQIVE YGLAHQDLSN LTHIGIDEIS REKGQVYLTN VYDLNTSRLV 
WSGEKRTKAT ITNFFTSLGP SKIDKLEGVC CDMWEPYTQV IQDKAPKATM VFDKFHIVRH 
LNEAVDQVRR DEIREKGQKH KDLVKDTRYI WLKNPWNLTD KQASRLSALE KLNLKINRAY 
LLKESFRQFW SYECRTSAKD FLDKWFWWAT HSRLKPMRNF AWMLRRKEEN ILSYFDMPIS 
NGSVEGLNNK AKVISHRAYG FRSAKNYIRN LYHCMGGLPE PQIMHRFV