Gene Rcas_2677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2677
Symbol
ID	5540159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3459724
End bp	3461067
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	66%
IMG OID	640894799
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001432766
Protein GI	156742637
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCTTT TTCCCCGTTA CAACGGACCA CCGTTGCTGC CGCAGATTTG CAGCGTCGAA 
AATCTGACGC TGGCGTGGCG GCGGGTGCGC AGCAACATCC ATGTCGCCCG GCGTGGGCGC 
AGCGCCGGAC CGGATGCGGT GACGCTCCGC GATTTCGAGG CGGACTGGAC GCGTCAGATG 
GCGCAACTGG CGGATGAATT GCAGCAAGGG ACGTATCGAC CGCTGCCCGC AAAGCGGATC 
GCCATCCCCA AGGCGAGCGG CGGCGAACGC GCAATCGCCA TCCTGTCCGT GCGAGATCGG 
GTGGCGCAGC GCGCCGTTCA ACAGGTGCTC GATCCGCTGT TTGATCCTTG TTTTCTAGAT 
TGTTCCTACG GCTGCCGTCC ACACGTCGGC GTACCGGAGG CGGTGGCGCG TGTGCAACGC 
TACGCCGACC AGGGGCTGGG ATGGGTGGTC GATGCCGATA TCGCCGGCTA CTTCGACGCC 
ATCGATCAGC GGGTGCTGTT GGGGCTGGTG CGGCAGCGCA TCGACGAATT GCCGGTGCTC 
AAACTGATCG CGCAGTGGCT CGAAGCCGGA ATGCTGCCTG GCGACGCGGC GCTGCCCGAC 
GAGGCGCCGG CGACGCCACT GCAACACGGT GAAGCCGTAC TTCGGCAGGT GATGTCCTGG 
GGCGCGGAGC GCCTGCCTCC ACCGCCGACC GGTCCCTACG CCGCAGCGGC GTGGGAAATG 
CCGGGTGGCA GTGTAGACGA CGGCTGGACG GTGCGCCGGT CGGGACTGGA GTCGCATCTG 
TGGACGGCGA TGATGCTGGC GCGACCGGCG ATCGATGGCG CACGGCGAGC GTTGCCCTAC 
CTGCAACGGA TCGGCGCACG TCGGCTCGCT GTCGTCGGCG CGGTGGCGGT CGGTGCGCTG 
GCATTGAGCG AAGCGGTTGC GCGCATGCAC ACCGCGCAGA GTCGTGGCAC GCCGCAGGGC 
GGTGCGCTCT CGCCGCTTCT GGCGAACATC TATCTCCATC CGTTCGATGT GGCCATGACC 
AGCCAGGGAT TCCGCCTGGC GCGCTTTGTG GACGACTTCG TGATCATGTG CGCAACGCAG 
GACGAGGCGG AACGGGCGCT GAACTTCGCG CAGCAGCAAC TGCGCGTCCT GCGCCTCGAA 
CTGAACGCCG AGAAAACGCG CATCGCATCC TACGCCAATG GGATCGAATT CCTCGGCGCA 
TCCCTGGCAC CGCGCGCCAA AGGGCAGCGC CTGGGCGAAG GGCTGGTCGA TTTCGCCGAC 
GCCGAACGCG TCCTGCGTGA CGCCATGCGC AATGCACGGC AACGGGTGCG GCGGAAGATC 
GAACGTGGGA AAGTTGAAGG TTGA

Protein sequence

MPLFPRYNGP PLLPQICSVE NLTLAWRRVR SNIHVARRGR SAGPDAVTLR DFEADWTRQM 
AQLADELQQG TYRPLPAKRI AIPKASGGER AIAILSVRDR VAQRAVQQVL DPLFDPCFLD 
CSYGCRPHVG VPEAVARVQR YADQGLGWVV DADIAGYFDA IDQRVLLGLV RQRIDELPVL 
KLIAQWLEAG MLPGDAALPD EAPATPLQHG EAVLRQVMSW GAERLPPPPT GPYAAAAWEM 
PGGSVDDGWT VRRSGLESHL WTAMMLARPA IDGARRALPY LQRIGARRLA VVGAVAVGAL 
ALSEAVARMH TAQSRGTPQG GALSPLLANI YLHPFDVAMT SQGFRLARFV DDFVIMCATQ 
DEAERALNFA QQQLRVLRLE LNAEKTRIAS YANGIEFLGA SLAPRAKGQR LGEGLVDFAD 
AERVLRDAMR NARQRVRRKI ERGKVEG