Gene Rcas_2959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2959
Symbol
ID	5540450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3839281
End bp	3840177
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	62%
IMG OID	640895079
Product	peptidase C60 sortase A and B
Protein accession	YP_001433037
Protein GI	156742908
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3764] Sortase (surface protein transpeptidase)
TIGRFAM ID	[TIGR01076] LPXTG-site transpeptidase (sortase) family protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0608881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000198401
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGCATA TTGCTCGCAA CAACCGCATC TCCCTGCAAA CCCCGCCGAA GATTCGGGGT 
CTGTCGCTCT TGCGGCGCGC ATCCGGTCGA AATGCCGTGC CGACGACATT CCGCGAAAAA 
CTCTTCTGGA CCCTGGGCAA TCTGCTGATG CTGATCGGCG CCATTCTCCT GGCGTATGTC 
GGCGGCATCT ACGCACAGGC CGATTTCAAC CGCTATGCCG CGCGTGGCGA TACCGACGTG 
CCGCCGCCTG CGCCCGTCGC GGCGCCACGC GCTCCCGATG CAGAACCGGC GCCCTTCGTC 
GCGCCGCAGC CCTTCGTCGC GCCACGCCTC AACACCGTTG AGGGGCGCAT CATCAGCGAC 
GTGCCGGACA TCGTCAGGTC CGCTATCCCG TCGCAGATTT CACGCATCAT TATTCCGAGT 
ATCGGCGTCG ACTCGAAAGT CGTCGAGGTC GGCTGGGAAG TCAAGGAACA GAACGGAACG 
CAGGTCGCAG TCTGGCAGGT CGCCGAGTAC GCCGTTGGTC ACCATCGAGG CTCTGCCAAC 
CCTGGCGAAG GGAGCAACAT CGTGCTTGCC GGTCATGTTG GCGGGTACGG CAAAGTTTTC 
AAAGACCTGA TTAACGTCAG GGAGGGCGAC CCGATCATCC TCTTCGCTGG CGGACGGCAG 
CACCTCTACG TGGTGCGTGA GCAGGTTCTG GTGCACGAAG AAGGGGTCTC ACCCGAACAA 
CAGGCAATGA ATGCCCTCTA CATCGCTCCA ACGAGTGAAG AGATGGTGAC GCTCATCACC 
TGCTGGCCCG ACCGCGGACC GGACAAGTTC AAGTACCGCA TCATCGTGCG CGCCACACCC 
TACGGCGCCG ACACCGATAC CCCGACCACC AACGCCGATG GTTGGACGGT GCGCTGA

Protein sequence

MKHIARNNRI SLQTPPKIRG LSLLRRASGR NAVPTTFREK LFWTLGNLLM LIGAILLAYV 
GGIYAQADFN RYAARGDTDV PPPAPVAAPR APDAEPAPFV APQPFVAPRL NTVEGRIISD 
VPDIVRSAIP SQISRIIIPS IGVDSKVVEV GWEVKEQNGT QVAVWQVAEY AVGHHRGSAN 
PGEGSNIVLA GHVGGYGKVF KDLINVREGD PIILFAGGRQ HLYVVREQVL VHEEGVSPEQ 
QAMNALYIAP TSEEMVTLIT CWPDRGPDKF KYRIIVRATP YGADTDTPTT NADGWTVR