Gene Rcas_3339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3339
Symbol
ID	5540837
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4356918
End bp	4358135
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	61%
IMG OID	640895456
Product	(Uracil-5)-methyltransferase
Protein accession	YP_001433407
Protein GI	156743278
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0683491
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATTT CAAATAAACA CTTTCGCCAG CAGATTATTG AGGCAGCGCG GGCAGGCGAG 
ACGACTACGC CGCGTTGCCC ACATGCGCCA CCGCAGGGTC AGTGCGGCGG ATGCGTCTTT 
CAAGATCACG ACTACCCGGC TCAGGTGGCA GCAAAACGCG CGGCGCTTTG CAGCCTCTGG 
AGCGATGACC TGCCAGACAA TTGTATCGAT ACGCTCGATG TCGTCGCTTC GCCGAACCCG 
TTTGCCTATC GCACACGCAT GGATTTTGTG GCGAGCAAGG AGCGATTTGG TCTGCGGCGT 
GGCGGCAGGT TCAACTACAT CATCGACCTG CATGAGTGCC ATCTCATCCC AACGCATGCC 
TTCACTGCCG CGCGCGCTGT GTACGAGCAC GCAATGGCGC TGGGGTTGCC CGACTACAAT 
CTGAAGACCC ATGCCGGTTT TCTGCGGTAT GTGGTCGTGC GGCGCAGCCC CGACGATGAA 
CTGCTGCTGG CGCTGGTTAC CGCCGCGCCC GAAGAAGAAA AGGTCTCTGC CGAAAAAGTT 
GAGCGTGTGG CGCTGGCAGC CCTTGAACAT CCGGGTGTGC TGGGCGTCCA TTGGCTGATC 
AACGCCACCC GCACCGACGT ATCGTTTGGC GAGCCGGTGC GTCACTGGGG GCGCGCAACG 
TTGCCAATGC GTGTTGGGGC GCACACGCTC GAAATCGGTC CCAATACCTT CTTTCAGAAC 
AATGTCTGGC TGCTGATGCC GCTGCTCGAG GCGGTGCGCG ACGCAGTCGC CGCATGCGGG 
CATGCAGGCG CAATCGCCGA TCTATACAGT GGGGTCGGCG CCATTGCGCT TCATATTGCC 
AGGCATGCGG ATCGAATTGT CTGTATCGAG TCATCTGGCG AGAGTGTGCG CCTGGCGCGC 
GAGAACAGCG TGCGCGCCGG GTTTGAGCAT ATCGCCGTGA TCGAAGCGGA TGTCGCCGAT 
GCGCTTCGCG CACAGACGAC CGGCGCATTC GATGTGGTTG TCGCCGATCC GCCGCGCACC 
GGTCTGGGTC CTGAGGTCTG TCGCGAGTTG CTGCGATTGC GCCCCCGGCG GATCGTGTAT 
GTCTCGTGCA ATCCGCTAAC GCAGCGTGAC GACATCCGCG CGCTGCAATC AGGGTATCGT 
CTGGTGTTGC TCCAGGGGTA CGACATGTTT CCACAGACGC CGCATCTGGA GGCGCTGGCG 
GTGCTTGATG TTATATGA

Protein sequence

MAISNKHFRQ QIIEAARAGE TTTPRCPHAP PQGQCGGCVF QDHDYPAQVA AKRAALCSLW 
SDDLPDNCID TLDVVASPNP FAYRTRMDFV ASKERFGLRR GGRFNYIIDL HECHLIPTHA 
FTAARAVYEH AMALGLPDYN LKTHAGFLRY VVVRRSPDDE LLLALVTAAP EEEKVSAEKV 
ERVALAALEH PGVLGVHWLI NATRTDVSFG EPVRHWGRAT LPMRVGAHTL EIGPNTFFQN 
NVWLLMPLLE AVRDAVAACG HAGAIADLYS GVGAIALHIA RHADRIVCIE SSGESVRLAR 
ENSVRAGFEH IAVIEADVAD ALRAQTTGAF DVVVADPPRT GLGPEVCREL LRLRPRRIVY 
VSCNPLTQRD DIRALQSGYR LVLLQGYDMF PQTPHLEALA VLDVI