Gene Rcas_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1147
Symbol
ID	5538613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1483858
End bp	1485153
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	58%
IMG OID	640893279
Product	peptidase M16 domain-containing protein
Protein accession	YP_001431262
Protein GI	156741133
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATACCT ATCCATCGTC TCCACAGTGT CATCTCTTGC CGGGCGGGCT GTGCGTGTTG 
ATCGAGCCAT TGCCTCATAT GCGTTCGGTA TCGGTCGGCT GTTTCGTTGG CGTCGGCGCC 
GGTCATGAGG AGCGGCACGA AAGCGGCATT GCGCATTTCA TTGAGCACAT GCTGTTCAAA 
GGCGCCCAAC GCCACCCATC GCCCAAACTC ATTGCCGATG CTATCGAGGG CATCGGCGGA 
ATCCTGGATG CCTATACCAG TTTTGAGTCG ACGGTCTACT ATGCCAAGGT GGCCGACATC 
TATTTTGACC GCGCGATTGA TGTGCTCTCC GACATGCTGA CGGCGCCGCG CTTTGATCCG 
CTCGATGTCG AGAAAGAGCG GCGCGTTATT GCGGAAGAAC TGCATCAGAC CGAAGACACG 
CCTTCGGAAC TGGTGCATCT GTTGCTCGAC GCGGCCATGT GGGGGGATCA ACCACTTGGA 
CGGGACATCG CCGGCAGCGA AGAGACGATT GCGGGATTGA CTGTCGAACA GATCGTCGCC 
TTCTGGCGCA TGCACTACAC CAGAAGAAAC ATGGTCATTT CGATCGCGGG TCATGTCGAT 
CCGCAACGCG CTCTTGATGC GGTCGCTGCC GCGTTTGATA CCCTTCCCGA AGGAGCGCCG 
GGAGTCTTTC TGCCCAGCAA GCCGCCGCTT CCCGGTCCGG CATTAACGCT GCGCTGCGAT 
GACAATGAAC AGGGAAACTT CTGCATTGGC TTTCGCGGCG TGGCATACAC CGACCCGGAT 
CGCCGCGCGC TGCTGGCGCT CGACACGGTC GTGGGCAGCG GTCCGTCGTC GCGCCTGTTC 
CAGGCAATCC GCGAAGAGCG AGGATTAGCA TATAACATTG GGAGTTATAG TCGCGAACAT 
CACGATACCG GAAAGTGGGT CGTTTTCGGC AGCGTCGAGC CACCAAACCT GCGTGAGTGC 
CTGGCAACCG TCATGGCTGA ACTGCGGCGC GTGCGCAATG AGGGGATTAC TGCCGATGAA 
CTCGCGCAAG TCAAGGAACA GGTAAAAGGC GGTATTCTTC TTTCACTCGA AGATACATGG 
GCGATTGCAT CACGCAATGG CGCCCATCAA CTGCGCTATG GGCGCGTGAT TCCGATTGAG 
CAGGTAGTCG CCGAAGTTGA AACTGTATCT CGTGAGGACG TACTGCGAGT CGCACAACGC 
GTCGTGCGCG ACGAGCATCT GCACATGGCG GTCATCGGTC CATACGATGA TGCTGCTGAC 
CTTAAAGAAC TCCTGACAGT GGAGCAATCA GCGTGA

Protein sequence

MHTYPSSPQC HLLPGGLCVL IEPLPHMRSV SVGCFVGVGA GHEERHESGI AHFIEHMLFK 
GAQRHPSPKL IADAIEGIGG ILDAYTSFES TVYYAKVADI YFDRAIDVLS DMLTAPRFDP 
LDVEKERRVI AEELHQTEDT PSELVHLLLD AAMWGDQPLG RDIAGSEETI AGLTVEQIVA 
FWRMHYTRRN MVISIAGHVD PQRALDAVAA AFDTLPEGAP GVFLPSKPPL PGPALTLRCD 
DNEQGNFCIG FRGVAYTDPD RRALLALDTV VGSGPSSRLF QAIREERGLA YNIGSYSREH 
HDTGKWVVFG SVEPPNLREC LATVMAELRR VRNEGITADE LAQVKEQVKG GILLSLEDTW 
AIASRNGAHQ LRYGRVIPIE QVVAEVETVS REDVLRVAQR VVRDEHLHMA VIGPYDDAAD 
LKELLTVEQS A