Gene Rcas_3546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3546
Symbol
ID	5541047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4624698
End bp	4626008
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	62%
IMG OID	640895665
Product	peptidase M16 domain-containing protein
Protein accession	YP_001433613
Protein GI	156743484
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.984037
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.12163
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAAT TTCCTGCCAA CCGCGCCAGC ACCATTGCAA CTGCAATTCG CTATACGCTG 
CCGAACGGCA TGGTAGCGCT GGTGCAGCGC AACCCGACCG CTCCAACGGT GAGTGTCTAC 
GGCGAGGTGC GTGTTGGAGC AGTGCATGAG CCTGCCGCAC AGAATGGTGT GGCTGCATTC 
ACCGGCGCCG CATTGATCCG TGGCACACAG CGACGCAGCT TCCAGGAGAT TGTCGCCACC 
ACGGAAGCGG TTGGCGCAAG CGTCAACGCC GGCGGCGGTC TGCACGCCAC CCATTTCGGC 
GGGCGATCAT TGAGCGAAGA CCTGGCGCTG ATCCTCGATC TTCTGGCAGA TATGCTGCGC 
ACGCCCTCCT TTCCCGACGA AGAAGTCGAG CGCCTGCGCG GTCAGTTTCT GATGATGCTA 
CGCGAATATG AGCAGGATAC CTCGGTGCGC GCCTCACGCG CGCTGCGGTC GCTGATGTTT 
CCGCCAGCGC ATCCCTACAG TCGCCTGAGC AGCGGCACGA CCGAGACGAT CTCGGCGTTG 
ACGCGCGATG ACCTGGTGCG TTTCCACACT CGCTACCACC CGGCAGTCAC AACGATTGCC 
GTGGTCGGCG ATATCGAACC GGCTGACGTC ATCGATCTGA TCGAACGGTT CTTCGGCGAC 
TGGCAGGCGC CTGGAAATCC GCCCCACATG ACGCTGCCCG ACCTGCAACC GTTGCCCGAT 
CAGCGGCGTG TCCACGTCGC CCTCGAAGGA AAGAGTCAGA CGGACGTTAT CTGGGCGGTC 
CATGGACTCG ACCGCTGTTC GCCGGATTAC TACGCCGCCA GCGTTGCCAA TATGATCCTG 
GGACGCATCG GCATTGGCGG GCGTCTCGGC GAGCGGGTGC GCGAAGAACA GGGGCTTGCC 
TATTCCTGCG GCAGCAGCCT CGACGCCGAC CTCGGCGCCG GTCCGTGGGC AGCGATGGCA 
GGGGTCAACC CCACACACGT CGAGCGAGCA ATCGCGGCGA TCATTGCCGA AATTAAACAG 
TTTGCCGCTG AAGGACCGAC GGAACAGGAA CTTGCCGATG TGCACGACTT TATGACCGGC 
AGCCTGGCGA TCAGCCTCGA AACGAATGAC AGCATCGCCG GGACGCTGCT CGGCATCGAA 
CGGTATCACC TTGGTCTCGA TTATGTCGAG CGCTATCCGT CGATCATTCG GCGCATCGAC 
CGTGAGCAGG TTATGGATGT GGCACGTCGC TATCTGGCGA CCGACAATTA TGTCGTGGTG 
ACTGCCGGAC CGGCGGTGGG AGAGGAACAC AATGAGCATA GTAACGGATG A

Protein sequence

MNQFPANRAS TIATAIRYTL PNGMVALVQR NPTAPTVSVY GEVRVGAVHE PAAQNGVAAF 
TGAALIRGTQ RRSFQEIVAT TEAVGASVNA GGGLHATHFG GRSLSEDLAL ILDLLADMLR 
TPSFPDEEVE RLRGQFLMML REYEQDTSVR ASRALRSLMF PPAHPYSRLS SGTTETISAL 
TRDDLVRFHT RYHPAVTTIA VVGDIEPADV IDLIERFFGD WQAPGNPPHM TLPDLQPLPD 
QRRVHVALEG KSQTDVIWAV HGLDRCSPDY YAASVANMIL GRIGIGGRLG ERVREEQGLA 
YSCGSSLDAD LGAGPWAAMA GVNPTHVERA IAAIIAEIKQ FAAEGPTEQE LADVHDFMTG 
SLAISLETND SIAGTLLGIE RYHLGLDYVE RYPSIIRRID REQVMDVARR YLATDNYVVV 
TAGPAVGEEH NEHSNG