Gene Rcas_2935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2935
Symbol
ID	5540425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3809423
End bp	3811498
Gene Length	2076 bp
Protein Length	691 aa
Translation table	11
GC content	61%
IMG OID	640895056
Product	peptidase S41
Protein accession	YP_001433015
Protein GI	156742886
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000791887
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0220512
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAC GTCCTTTCTG GTATATCGGA GCGATTGCGG CTTTGCTTCT GGCGCTTGCC 
GCTTGTGGCG GCGGCGCGCC GACCAACCTG CTGCCGGCAC AGGATGCGAC TGCCGTCAAC 
CCGTCGAATG TCTCGCCCGT AGCAGAGGCG ACCGCCTCGC CGGAGGTGAT CACGCCGTCG 
CCGATCCCGT CCCGTACAGC AACAGGCGGC GTTGAGGTGA TCACCGGCGA GTTCACGTAT 
ACCAACGATA TCATTACCAC CTACTATGTC GAACACGCTG TCGGGTTGGT CGATCTCTAC 
GGCTTCATCA CTCGTGATGA GGAATGGGAA CTGCCGGTCG AGAGTCAGGC GCTGGGACCA 
CTGACCATCG ATCTGGAGCG GCAGCGCGGC GAGTTTCGCC TGGCTCTGCC GGCGCGTCCG 
GCAGGAGTGC TGGCTGATGT CGATAACAAC ACCCAACGCG ATACCGGCGT ACAGGTGTTC 
GTGGTGGCGT ACTGGCCCAA TTTGTATGGC GGTCCCTTTT CCGAAGGGGA CGACCGCAGT 
TTCGGGTGGC CCGCCTATCT GGCATCGACG GTCAACGATC CGGAGAACAA CGATGAGATC 
ACCGGCGGCA AACTGGTAGT GTGGGCGCCG GACGAAGCGC AACAGTTCCC AACCGATTTT 
GGCGCCGATG GGTTGCTGTT TACCGCCGAT GATCCGGTTG GTCCGCTCGC TGCCGGGTAT 
TCGGTCATCG ATCTCGATCA GCGTCCGTTT GGCATCGAGC GCAACCGTGA AGAGCAGGTG 
ACGCTGCACG AACCGCCGGA TGCAGCGATC AAAGATTTCT CCGATCTGTC GTATACCAGG 
GCGTTCGATG AAATGTTCAA ACGGGTGCGG GTCGAATATG CCTTCAACGG CATTCCCGGA 
AAAGCGCCGG ATTGGGATGC ACTTTATGCA AACCTGGCGC CGCGCGTTGC CGAAGCGGAA 
CGCCAACAGG ATCGCCGCGC GTTTTTTGAG GTCATGTTCG ATTTTGCGAA TGCCTTCCGC 
GATGGGCACG TTGGCGTCAA TTCGCCGCTT TCCGGCGCGC TGTTCCGTGA ACGCGCCGCC 
GGCGGGTATG GGTTCGCCAT CCGCGAATTG GATGATGGTC GCGCGCTGGT GGTCTTCGTG 
ACGCGCAATG GTCCTGCCGA TCGCGCGGGT GTGCAGGTCG GCGCCGAATT GCTGGCGTTC 
AACGGCGCGC CGGTCAAAGA CGCAATTGCT GCCGTCGAGC CATTGGGGGG ACCGTTCTCG 
ACCGACTTTG CGCTGCGCTA TCAGCAGGCG CGTTACCTGT TGCGCGCGCC GGTCGGGACG 
CAAGCGCAGG TGACGTTCGC CAACCCGCGT GGTGCGCCGC AGACGGTCAC GTTGCGTGCG 
GTGGAAGAAC GCGACAGTTT TTTTGCGACA TCGATCTTCC AGGAGAGCAA CCCGGCGGCG 
CTGCCGGTCG AGTTCGAGCA GCGCGCCTCT GGCGTCGGGT ATATTCGTAT CAATTCCAAC 
TACGATGACC TGAATCTGCT GATCCGTCTG TTCGAGCGGG CGCTCAAGAC GTTCGACGAC 
CTGGATGTTC CCGGCATTAT TATCGACATG CGGCAGAATA GCGGCGGTGC GCCGCTGGGA 
CTGGCAGGGT TTCTGTCCGA CCGGGAGATC ATCATCGGTC AGGACGAATA CTACAGCGAA 
CGTACCGGTC GGTTCGAGCC AGAAGGTCCG CTCGATACGA TTCTGCCGCA CCAGAACCAG 
TACCGTTTCG ACAAGATTGT GCTACTGGTC GGGCAGGCGT GTTTCAGTGC ATGTGAATTC 
GAGTCGTATG GATTCAGCAA AGTTCCCGGC GTGATTGTGA TTGGTGAAAC GCCGACCGCT 
GGGGTGTATG CCGAGGTGTC GCGCGGGCAG TATGTGCTGC CGGACGACAT CTTCCTCCAG 
GTCCCGACCG GTCGCACGCT GCTGCCGGAC GGTGCGCCAC TGCTGGAAGG AGTGGGAGTT 
GTGCCGACGA TCCGTGTGCC GGTGACTGCC GAAACCGTGC TGTCGAACCG TGACGCAGTG 
CTCGAGCGCG CGGAGCGAGA AATTGTCGGG CGTTAA

Protein sequence

MKQRPFWYIG AIAALLLALA ACGGGAPTNL LPAQDATAVN PSNVSPVAEA TASPEVITPS 
PIPSRTATGG VEVITGEFTY TNDIITTYYV EHAVGLVDLY GFITRDEEWE LPVESQALGP 
LTIDLERQRG EFRLALPARP AGVLADVDNN TQRDTGVQVF VVAYWPNLYG GPFSEGDDRS 
FGWPAYLAST VNDPENNDEI TGGKLVVWAP DEAQQFPTDF GADGLLFTAD DPVGPLAAGY 
SVIDLDQRPF GIERNREEQV TLHEPPDAAI KDFSDLSYTR AFDEMFKRVR VEYAFNGIPG 
KAPDWDALYA NLAPRVAEAE RQQDRRAFFE VMFDFANAFR DGHVGVNSPL SGALFRERAA 
GGYGFAIREL DDGRALVVFV TRNGPADRAG VQVGAELLAF NGAPVKDAIA AVEPLGGPFS 
TDFALRYQQA RYLLRAPVGT QAQVTFANPR GAPQTVTLRA VEERDSFFAT SIFQESNPAA 
LPVEFEQRAS GVGYIRINSN YDDLNLLIRL FERALKTFDD LDVPGIIIDM RQNSGGAPLG 
LAGFLSDREI IIGQDEYYSE RTGRFEPEGP LDTILPHQNQ YRFDKIVLLV GQACFSACEF 
ESYGFSKVPG VIVIGETPTA GVYAEVSRGQ YVLPDDIFLQ VPTGRTLLPD GAPLLEGVGV 
VPTIRVPVTA ETVLSNRDAV LERAEREIVG R