Gene Rcas_4073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4073
Symbol
ID	5541584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5286524
End bp	5287732
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	62%
IMG OID	640896185
Product	SAM-dependent methyltransferase
Protein accession	YP_001434123
Protein GI	156743994
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.910073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.355186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCGTC GTGTGGAAAT CGTTGTGCCG TCGTTGCTGC GCGAGCGACT GGCGCAGGGG 
CATCCATGGG TCTACCGCGA CCATGTTTCT CCCCATGTGC GTCTGCCGTC CGGCGCCTGG 
GTTATCGTTC GTTGCGGCGC CTGGCGCGGG TATGCGCTGT GGGATGCGGA AGGTCCGATT 
GCGTTGCGCA TCTTCTCGAC GCGCACCGTC CCCGACATCG CCTGGCTACG TGAGCGTCTG 
ACTGCTGCGT GGAATCTGCG GGCGCCGCTG CGTGCGGCAG GCATCACGGC GTATCGCTGG 
GTTTTTGGCG AAGGAGATGG AGTGCCCGGC ATTGTCGTGG ATCGCTATAA CGATATTGCT 
GTCCTCCAGG CGTCTTCCGC CGGTACGCTG ACCCTCATCG AAGACGTGGC GACTGCCATT 
CTCAAGGTCG ATCCGACGGT GCGCCGTGTG GCGCTGCGTA TGGCAACGGA GTCGCGTTCA 
GCAATAGATG AAGGCGACGA AGGCGATGGT GACGCGCGGC TACGATCACT GTACGGTGAG 
TCGCCGCCGC GCGAGATTGT GGTGGTCGAG CACGGGATCC GTTTTGCCGT TGCGCTTCAC 
ACGGCGCAGA AAACCGGGTT GTTCCTCGAT CAGCGCGAGA ATCGGCGTTT TGTCGAAGGA 
CTCGCTGCCG GGCGCACGGT GCTGAATTGC TTCGCCTATA CTGGCGGGTT TTCGCTCTAT 
GCCCTGCGCG GCGGTGCGCG GCAGGTCGTT AGCGTCGATG TTGGCAAGGG TCTGGCATCG 
GCGACGGCGC GCAATCTGGC GCTTAACCGT CTCGACGATG GACGCCATCG CTTCGAAACT 
GCCGATTGTT TCGAGTTGCT GGAGCAGTAT GCCGCAGCCG GTCAACGCTT CGATCTGGTC 
ATTCTCGACC CTCCCAGTTT TGCGCGGCGC AAAGAGAGCC GATATGCCGC ACAGCGCGCG 
TATGTGCGAC TTAATGCGCT GGGCATGCGC TGCGTGAAAC CTGGAGGTCT GTTGGCGACT 
GCGAGTTGCA CCACACAGGT GGGACCAGAG GCGTTCCGTG AGGCGCTGGC ATCCGCAGGC 
GCTCTTGCCG AGCGGCGGCT GCGGATTATC CACGAAGCCG GTCAACCGCT CGATCATCCG 
GTTCCGGCAC ATTTTCCCGA AGGGCGGTAT TTGAAGTTCG TGGTTGGGCG GGTGGAGGAA 
GCAGTGTAA

Protein sequence

MVRRVEIVVP SLLRERLAQG HPWVYRDHVS PHVRLPSGAW VIVRCGAWRG YALWDAEGPI 
ALRIFSTRTV PDIAWLRERL TAAWNLRAPL RAAGITAYRW VFGEGDGVPG IVVDRYNDIA 
VLQASSAGTL TLIEDVATAI LKVDPTVRRV ALRMATESRS AIDEGDEGDG DARLRSLYGE 
SPPREIVVVE HGIRFAVALH TAQKTGLFLD QRENRRFVEG LAAGRTVLNC FAYTGGFSLY 
ALRGGARQVV SVDVGKGLAS ATARNLALNR LDDGRHRFET ADCFELLEQY AAAGQRFDLV 
ILDPPSFARR KESRYAAQRA YVRLNALGMR CVKPGGLLAT ASCTTQVGPE AFREALASAG 
ALAERRLRII HEAGQPLDHP VPAHFPEGRY LKFVVGRVEE AV