Gene Rcas_3798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3798
Symbol
ID	5541300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4969544
End bp	4970647
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	63%
IMG OID	640895908
Product	NHL repeat-containing protein
Protein accession	YP_001433855
Protein GI	156743726
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.88272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGCC CACTCGTCTG GATCGGCGCG CGTTCGCCTG GTGCATTGAC GCTTCCCCCT 
GCCGACCCGA CGCCGTCGCA GTTGTACGCA CCACGTGGCG TCTATCTCGA TGATCAGACG 
CTGATTGTCG CGGATTCCGG CAACCATCGC GTGCTCATCT GGCATCGCAT CCCTGATCGG 
GACGGACAGC CGGCTGATGT GGTGCTGGGA CAACCCGATT TCTACAGCGA GGGACCGCAG 
GCTGCCGGGC GCGGCTCGCG GCACGGGATG CACCTGCCGA CCGGTGTGAT GGTGATCGAT 
GGACGGTTGT GCGTCGCCGA TTCGTGGAAC CACCGCATTC TGGTGTGGAA TCGCGTTCCT 
GAGACCTCGA ACGCTCCGCC GGATAGGGTC ATCGGGCAGG CGGACCTGGA CGAATGCGAG 
CCGAATCGTG GCGGCGGCGT CACAGGGTGT GGATTCTATT GGCCCTACGG AATCGGATGG 
GTTGCCGGTC GTTTTTACGT CGCCGATACC GGCAACCGCC GCGTCCTCAG TTGGAACAGT 
ATTCCTGAAG ACAGACAGCC GCCCGACCTG GTGCTGGGTC AGAACGACGA GTGCAGCCAT 
GCCGAAAATC GTGGCGAAGG GCCGTCGCCA TGTTCGTTTC GCTGGCCCCA CGCGATTGCC 
GGCAATGGCA CAACCCTGTA TGTCGCCGAT GCCGGCAACC ACCGTGTGCT CGGCTGGACG 
CCAATCCCCG CGCGCGATAC ACCGGCGTGC CTGGCGCTCG GTCAACGCGA CTTTCAGAGC 
GCGTGGGAGA TGCCCCACAC GCCACCGGGA CCTTCCGCAC TCCGCTTCCC GTATGCGGTC 
GCGTGCGCAT CCGGCAGGCT GATCGTCGCT GATACTGCCA ATAATCGGGT GCTGATGTGG 
CACACGTTGC CGCGTGCAGG CGTGTTTCTG CCCGCCGATA TGGTCATCGG GCAGCCGGAT 
TTTGCCGGCA ACGGCGAAAA TCGCTGGCAG GCGGTCGAGC GCGATACCCT CTGCTGGCCC 
TATGGTATAT CCTGTCACAA CCATCGTTTG GCGATTGCCG ATTCGGGCAA TAATCGTGTT 
ATCATATGGG ATATCAGCGT CTGA

Protein sequence

MVRPLVWIGA RSPGALTLPP ADPTPSQLYA PRGVYLDDQT LIVADSGNHR VLIWHRIPDR 
DGQPADVVLG QPDFYSEGPQ AAGRGSRHGM HLPTGVMVID GRLCVADSWN HRILVWNRVP 
ETSNAPPDRV IGQADLDECE PNRGGGVTGC GFYWPYGIGW VAGRFYVADT GNRRVLSWNS 
IPEDRQPPDL VLGQNDECSH AENRGEGPSP CSFRWPHAIA GNGTTLYVAD AGNHRVLGWT 
PIPARDTPAC LALGQRDFQS AWEMPHTPPG PSALRFPYAV ACASGRLIVA DTANNRVLMW 
HTLPRAGVFL PADMVIGQPD FAGNGENRWQ AVERDTLCWP YGISCHNHRL AIADSGNNRV 
IIWDISV