Gene Dret_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0152
Symbol
ID	8417956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	195505
End bp	196905
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	60%
IMG OID	645036717
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_003197032
Protein GI	258404290
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.765246
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.510076
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACG GAGCCGCAGA AGGACGGGCT GGGACGCCCG TCGCCACACC CGAGGGTAGG 
GGACGGAATC CCCGAGAGTA CGGTAGTGGT GCGTCAAGCG TCACGGCAAC GAAGGAGTAC 
TCCCATCCGG AGCAGCAGAG TTTGATGGAA GCGGTGGTCG GACGCGAGAA CATGCTTGCG 
GCCTACAAGC GTGTACGCGC CAACAAAGGC GTCCCCGGAG TCGACGGCAT GAGCGTCAAC 
GACGTATGGG GATATTGCAC GCTCAACTGG GCCCGAATCA AAGAGGAGTT GCTGGACGGA 
CGGTACGAGC CGCAGCCGGT GCTCGGGGTG GAAATCCCTA AACCCGGCGG CGGGGTGCGC 
CAACTGGGCA TCCCGACGGC GCTGGACCGC CTGATACAGC AGGCGCTGCA CCAGGTGCTC 
TCCCCCATTT TCAACCCTCA CTTCTCCGAA TCCAGCTACG GCTTCCGGCC CGGTCGAAGT 
GCGCATCAGG CCGTGCTCAA GGCACGGGAG CATGCTGCCG CCGGCAAACG GTGGGTCGTG 
GACATGGACC TGGAGAAGTT CTTCGACCGC GTGAACCACG ACGTGCTCAT GGCGCGCGTG 
GCCCGCAAGG TGAAGGACAA GCGGGTGCTC GTCCTCATCC GGCGTTACCT GCAAGCGGGG 
CTGATGCAGG GGGGAATTGC ATCGAAACGA AAGGAGGGCA CGCCGCAAGG CGGCCCCCTC 
TCGCCGCTCT TGTCCAACAT CCTTCTGGAT GACCTGGACA AGGAGCTTGA ACGCAGAGGC 
CACGCGTTCT GCCGATACGC CGACGACTGC AATATCTACG TGCAAACAAA ACGGTCCGGC 
GAACGCGCAA TGGCCTCGAT CACCCGGTTT CTGACAGAGC GGTTGAAGTT GAGGGTCAAC 
GCGGATAAGA GCGCGGTTGA CCGGCCATGG AAAAGGAAAT TCCTTGGGTA CTCGATGACC 
TGGCATACGC AGCCGCGGCT CAAGGTTGCG CCCAGTGTGG TCAAACGCCT GAAACAGGCG 
GTACGGGAGG AATTTCGACG TGGGCGGGGA CGGTCGCTCA AGAAGACGAT AGACACCCTT 
GCGCCGAAAC TGCGAGGCTG GATGAACTAC TTCAAGCTGG CGGAGGTAAA GGGAGTTTTT 
GAAGAACTGG ACATGTGGAT TCGCCGCAGA TTGCGCAATA TCCTGTGGCG GCATTGGAAA 
CGACCCTACG CCCGAGCAAG GAACCTGATT CGCCGGGGAC TGACTGAAGA GCGCGCCTGG 
AAATCCGCCA TCAACGGCCG CGGGCCATGG TGGAACTCCG GCGCATCGCA TATGAACCAG 
GCATTCCCCA AGAAATACTT TGATTCACTT GGACTCGTGT CACTGCAAGA TCAACTTCGC 
AAAGCTCAAA GTGTCAGGTG A

Protein sequence

MTNGAAEGRA GTPVATPEGR GRNPREYGSG ASSVTATKEY SHPEQQSLME AVVGRENMLA 
AYKRVRANKG VPGVDGMSVN DVWGYCTLNW ARIKEELLDG RYEPQPVLGV EIPKPGGGVR 
QLGIPTALDR LIQQALHQVL SPIFNPHFSE SSYGFRPGRS AHQAVLKARE HAAAGKRWVV 
DMDLEKFFDR VNHDVLMARV ARKVKDKRVL VLIRRYLQAG LMQGGIASKR KEGTPQGGPL 
SPLLSNILLD DLDKELERRG HAFCRYADDC NIYVQTKRSG ERAMASITRF LTERLKLRVN 
ADKSAVDRPW KRKFLGYSMT WHTQPRLKVA PSVVKRLKQA VREEFRRGRG RSLKKTIDTL 
APKLRGWMNY FKLAEVKGVF EELDMWIRRR LRNILWRHWK RPYARARNLI RRGLTEERAW 
KSAINGRGPW WNSGASHMNQ AFPKKYFDSL GLVSLQDQLR KAQSVR