Gene Rcas_4389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4389
Symbol
ID	5541902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5641245
End bp	5642426
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	67%
IMG OID	640896489
Product	radical SAM domain-containing protein
Protein accession	YP_001434425
Protein GI	156744296
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.484216
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTCG ATGAAAAACT CGCCATTCTG GCGCCGGCGG CGCGCTTCGA TGCCTGCGAC 
CGGTTCCTGG GGAAACGCCG CGCGCCGCCC CCTGCAACCG GATGGAACGA CGACGCTGTG 
GTTGCCGATG CCGACAGCGA TGGGCGCGCG TTGCCGGTCT TCCGGTTGTT GCTGAGCAAC 
CGCTGCGAAT GGAACTGCGC CTACTGCCCG TTGCGCTCCG GCAACGACAT GCCGCGCGCC 
GCGCTGAACC CCAACGAACT CGCGCGCGTC GTTCTGCCGC GCGTCGAACG AAAGACGGTG 
CAGGGGTTAC TTATCTCCAC TGGGGTCGAT GGCAGCCCGT CCGTTGCGAC CGAACGCCTG 
CTCGATGCTG TTGAAGCGCT GCGCGCGCGC CATGGCTATA CCGGGTACGT CCACCTGAAA 
TTGCCACCCG GCGCGCCCGC TGCGGACATT GAGCGCGCCG CGCGCCTTGC CGACCGTATC 
AGCCTGAATC TGGAAGCGCC GACGGCAATG CACCTGGCGC GTATTTCGCC GGAGCGCGAC 
TGGCTGCGCG ACCTGATCGC GCCGCTGGCG CTGGCGCGCG ACTGGAGTCG GACCGGCGCT 
ATTCGGGCGG GGCTTGCGAC GCAGTTCGTG GTCGGCGCGG CCGGCGAAAG CGACCACGAT 
CTCCTGGTGA CAACCACGTG GCTCTACCGC GACCTGGGGT TGCGGCGCGT CTATTTTGGC 
GCGTTTCGAC CGGTTGCCGG CACGCCGCTG GAGCAGCGCG CACCCACGCC ATTCGTGCGC 
GAACAGCGCC TCCGCGAAGC CGACTGGCTG GTGCGGCGCT ACGGCTTCGA TCAGCGCGAA 
TTGCCCTATG ATGCGGCAGG CAACCTGCCG TTGCACATCG ACCCAAAACT GGCCTGGGCG 
TTGGCGCACC CCGAACGCTT TCCGGTTGAA CTGAACAGCG CCGACCGCGA CGAACTGTTG 
CGGGTGCCGG GGTTGGGTCC GGTGAGCGTG GCGCGCATTC TTCGTCTGCG GCGTGAAGGG 
CGCTTTCGCG AACCGGCGCA CCTTGCAGCG CTCGGCGGAG CGCTTGCGCG CGCCCGTGAC 
TTTGTGACGC TCGATGGACG CTTTTTCGGC AGGAACGAAC GTGACCGCCT GCGCCATTAT 
GCCCGGCAAT CGGAAATTGC CGAGCAGTTG ACCTTGTGGT AG

Protein sequence

MDLDEKLAIL APAARFDACD RFLGKRRAPP PATGWNDDAV VADADSDGRA LPVFRLLLSN 
RCEWNCAYCP LRSGNDMPRA ALNPNELARV VLPRVERKTV QGLLISTGVD GSPSVATERL 
LDAVEALRAR HGYTGYVHLK LPPGAPAADI ERAARLADRI SLNLEAPTAM HLARISPERD 
WLRDLIAPLA LARDWSRTGA IRAGLATQFV VGAAGESDHD LLVTTTWLYR DLGLRRVYFG 
AFRPVAGTPL EQRAPTPFVR EQRLREADWL VRRYGFDQRE LPYDAAGNLP LHIDPKLAWA 
LAHPERFPVE LNSADRDELL RVPGLGPVSV ARILRLRREG RFREPAHLAA LGGALARARD 
FVTLDGRFFG RNERDRLRHY ARQSEIAEQL TLW