Gene Rcas_3323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3323
Symbol
ID	5540821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4336197
End bp	4337285
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	63%
IMG OID	640895440
Product	metalloendopeptidase glycoprotease family
Protein accession	YP_001433391
Protein GI	156743262
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACGA ATTTCACTAT TCTGGCAATC GAAACATCGT GCGACGAGAC GGCAGCAGCG 
GTTATCCGTG GCGGTCGCAT GATCGTCTCG AATGTCGTGG CGTCACAGAT TGAGGAGCAT 
CGTCGCTACG GCGGCGTCGT TCCCGAAGTC GCGTCGCGTC AGCATATTTT GACGATCGAT 
GCCGTGGTGC GTGATGCGCT GCACCCGCTC CCTGGCGGGT GGAACGACAT CCATGCCGTC 
GCAGCGACGT ATGGTCCTGG TCTGGCAGGC GCGTTGATGA CCGGGTTGAA TGTCGCCAAG 
GCCATTGCCT GGATGCGCGA ACTGCCCTTC ATTGGGGTCA ACCATATCGA AGCGCATATC 
TATGCGAACT GGTTGCTGAC CGATGCGCAG CCCGATGCGC CCGAACCACA GTTCCCCGTC 
GTTGCGCTGG TCGTCAGCGG CGGGCATACG CTGCTGGCGC TACTCGAAGG GCACGGCCGC 
TACCGCATGC TTGGGCAGAC CCGTGACGAT GCGGCGGGCG AGGCGTTCGA TAAAGTTGCG 
CGGTTGCTGG GGCTTGGATT CCCTGGCGGA CCCGCCATTC AGACGGCGGC TGAAAACGCG 
CCTGGCGGCG TCACGCTGCC GCGCGCCTGG TTGCGCGACA GTTACGATTT TTCGTTCAGC 
GGCTTGAAAA CCGCAGTGCT CCACCAGATT CGCGAGTATC GGGCGCGCGA GGCGGCGCTT 
CAGCCCGGCG CCGGCAAACG CGGCGCATCC GCAGCAACCG AACCACCGCC TCTTCCTCCA 
GCGATTGTTG CGCGTCTGGC GCGCGCCTTC CAGGAATCGG TCGTGGACGT GCTGGTGACC 
AAAACAGTTG AGGCGGCACG CGCCTTCGGC GCAGCCGAAG TGGTACTGGC AGGCGGCGTG 
GCGGCCAACC TCCGTCTACG CGAGGAACTC TGTCGCCGCT CGCCTGTTCC GGTGCATATC 
CCGCCTGTCG CCCTCTGTAC CGATAATGCC GCCATGATTG GCGCAGCCGC CTTCTACCGC 
CTCAATGCTG GCAAACAGGA TGGATGGGAC CTCGATGTGC AGCCGAATCT TCCGTTACAT 
GCGGGGTAG

Protein sequence

MDTNFTILAI ETSCDETAAA VIRGGRMIVS NVVASQIEEH RRYGGVVPEV ASRQHILTID 
AVVRDALHPL PGGWNDIHAV AATYGPGLAG ALMTGLNVAK AIAWMRELPF IGVNHIEAHI 
YANWLLTDAQ PDAPEPQFPV VALVVSGGHT LLALLEGHGR YRMLGQTRDD AAGEAFDKVA 
RLLGLGFPGG PAIQTAAENA PGGVTLPRAW LRDSYDFSFS GLKTAVLHQI REYRAREAAL 
QPGAGKRGAS AATEPPPLPP AIVARLARAF QESVVDVLVT KTVEAARAFG AAEVVLAGGV 
AANLRLREEL CRRSPVPVHI PPVALCTDNA AMIGAAAFYR LNAGKQDGWD LDVQPNLPLH 
AG