Gene Rcas_4069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4069
Symbol
ID	5541580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5282028
End bp	5283299
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	640896181
Product	carboxyl-terminal protease
Protein accession	YP_001434119
Protein GI	156743990
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.686351
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTC TACGACAATT ATTCCGTCTG CGACTGCCGA TCTGGTTAGT GACGCCGTTG 
CTGGCGTTTG TGCTGACGCT GGGAATCGGC GGCGGCTATC TGCTGGCGTT GCGTGTGACT 
ACTCCCTGCC CGCTCCAGGC GCAAGAGTGC GCCGCGTTGA CGAATTTCTG GCGTGTGTGG 
CAACTGGCGC GCGACCATTT TGTTGACCCG GCTGCGATTG ATCCGCAGCG CATGAGCGAC 
GGTGCGATCA ATGGCATGCT CGATAGCCTG GGAGACCAGG GTCACACGCG CTACCTGAAT 
GCAGACGAAG CCCGACGGGA GCGTGAGGCG CTTTCCGGCA GATTCGAGGG CATTGGCGCC 
TATATCGACG TGCGCGACGG GCAGCCGCGA ATTGTCGCTC CTATCGAGGG ATCGCCAGCC 
GAACGCGCCG GGTTGCGCCC CGACGACCTG ATTCTGCGCG TCGATGGATA CGATGTGCGG 
GGGGTGACCG TGGAAGAACT GCGCAACCGG GTGCGTGGTC CAAAGGGGAC GCAGGTGGTA 
TTGACCATTC AGCGCGCCGG TGTGGCAGCG CCGTTCGACG TGACGATTAC GCGCGAGGAG 
GTGAATGTTC CCAGTGTCAC CTGGCGCATG CTGCCCGACC GTATTGCGCT GATCAAGATC 
AATCGTTTCG CCGAGCGCAC CGGAGCGGAG TTGCAACAGG CGCTGCTGGA GGTTCGGGCG 
CAGAAGGCGC AGGCGATCAT TCTCGATCTG CGCAACAACC CCGGTGGTCT GGTGACGCAA 
CTGGTCGCTG CGGCCAGTCA GTTTATGCCA GAAGGGAGCA CGGTGCTCAT CGAACAGGAC 
CGTGACGGCG CCCAACGGCC ATACACAACC ACCGAAGGCG GACTGGCGCT CGATATTCCG 
CTGGTTGTGC TGGTGAACAA CAACAGCGCC AGCGCCGCCG AGATCCTGGC AGGCGCGTTG 
CAAGAGAACG GACGCGCGCG CGTGATCGGG CAGGCGACGT TTGGCACGGC AACGGTTCTG 
CGTCCGTTTG ATCTGGAAGG CGGCGCACAG GTGCGTCTGG GCGCCTCACA GTGGCTGACG 
CCGAAGGGCA GGGTGGTGCG CGGTGTGGGC ATTCAGCCCG ATGAATTGAT CGCGCTGGCG 
CCAGGGGTTG CGCCACTCAC CCCGACTGAA GCGGCAACTC TCACCCCGGA GGAATTGCAG 
CGCAGTCAGG ATATTCAGTT GTTGCGCGGG CTTGAAGTAG TGCGCGAGGC GCTGGCGCAA 
AAAACGTCGT AA

Protein sequence

MNILRQLFRL RLPIWLVTPL LAFVLTLGIG GGYLLALRVT TPCPLQAQEC AALTNFWRVW 
QLARDHFVDP AAIDPQRMSD GAINGMLDSL GDQGHTRYLN ADEARREREA LSGRFEGIGA 
YIDVRDGQPR IVAPIEGSPA ERAGLRPDDL ILRVDGYDVR GVTVEELRNR VRGPKGTQVV 
LTIQRAGVAA PFDVTITREE VNVPSVTWRM LPDRIALIKI NRFAERTGAE LQQALLEVRA 
QKAQAIILDL RNNPGGLVTQ LVAAASQFMP EGSTVLIEQD RDGAQRPYTT TEGGLALDIP 
LVVLVNNNSA SAAEILAGAL QENGRARVIG QATFGTATVL RPFDLEGGAQ VRLGASQWLT 
PKGRVVRGVG IQPDELIALA PGVAPLTPTE AATLTPEELQ RSQDIQLLRG LEVVREALAQ 
KTS