Gene Csal_0044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0044
Symbol
ID	4027223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	52018
End bp	53340
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	68%
IMG OID	637965196
Product	carboxyl-terminal protease
Protein accession	YP_572108
Protein GI	92112180
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCAA GCCAATCCCG TTCCCCGCGC CTCGTCGTGC GCCATTGCCT GCACCTGGGC 
ATGGCCCTGG CGATCGGTGC GCTGACCCTG CCGCTGCCCG CGCATGCCCA ACAGCCGGCC 
GGCGACGACG CCCTGCCCGT GGAAGACGTG CAAACCTTCG CCGAGGTCTT CGAGCGCATC 
AAGCGGGCCT ATGTCGACGA GGTCGACGAC ACCACGCTGA TGCGCAACGC CATGCGCGGC 
ATGCTCGGCG AGCTCGACCC GCATTCCGCC TATCTCGATG CGGAGTCCTT CGAGGCACTC 
CGCGAAACCA CCGAGGGCGA GTTCAGCGGC GTGGGCATCG AGGTCGGCAT GCAGGAAGGC 
CAGTTGACGA TCATCGCCCC CATCGACGAC AGCCCCGCCG CACGTGCCGG ACTCCAGGCA 
CAGGACGTCA TCCTGCGCAT CGACGACACG CCCACCGAGA GCCTGTCGCT GCAGGAGGCC 
GTGGAAATGA TGCGCGGCGA CGAAGGCGAG GAGATTCGCC TGACCATCCT GCGCGAGGGC 
GAGGAAGCCC CGCGCGAGGT CACGCTGACC CGCGAGACGA TCCGCACCGA CAGCGTCAAG 
CATGAGATGC TGTCGCCGGG CTACGGCTAC CTGCGCATCA GCCAGTTCCA GAGCCGCACC 
GGCGAACAGG CCCGCGATGC CATCGCCGCA CTGCGCGAGG AAGGCGACGG CAATCTCAAG 
GGCCTGGTGC TGGACCTGCG CAACAATCCC GGCGGCGTGC TCGACAGTGC CGTCGATGTC 
GCCGACCTGT TCCTCGACAG CGGGCTGATC GTCTATACCG AAGGCCGCCT GGCAGACAGC 
GACATGCGCT TCTCGGCCTC TCCCCAGACC AGCGCCCCGG ACGTACCCAT GGTCGTGCTG 
ATCAACGGCG GCAGTGCCTC GGCGGCGGAG ATCGTCGCCG GTGCCCTGCA GGACCAGCAA 
CGCGCCGTGC TGATGGGCAC CGAAAGCTTC GGCAAGGGCT CCGTGCAGCA GGTGCTGCCG 
CTCAACAACG GCGACGGCCT GAAGCTGACC ACCGCGCTCT ACTACACGCC GGACGGCCGC 
TCGATCCAGG CTCAGGGCAT CGCCCCGGAC GTCGAAGTCG TGCGCGGTCG CCTCGAGGTC 
GCCGAAGCCA CCGGCCTGAG CATCCGCGAG TCGGATCTCG AGAATCACCT GCGCAACATC 
AACGGCGAGC GGGAACGCAC CGAGCGCGAA AGCTCCCTCG CCGAAAGCGA CTACCAGCTC 
GGCGAAGCCC TCAACCTGCT CAAGGCCCTC AACGTCCTGC CCCGTGCCCA GAGCGGCAAC 
TGA

Protein sequence

MTASQSRSPR LVVRHCLHLG MALAIGALTL PLPAHAQQPA GDDALPVEDV QTFAEVFERI 
KRAYVDEVDD TTLMRNAMRG MLGELDPHSA YLDAESFEAL RETTEGEFSG VGIEVGMQEG 
QLTIIAPIDD SPAARAGLQA QDVILRIDDT PTESLSLQEA VEMMRGDEGE EIRLTILREG 
EEAPREVTLT RETIRTDSVK HEMLSPGYGY LRISQFQSRT GEQARDAIAA LREEGDGNLK 
GLVLDLRNNP GGVLDSAVDV ADLFLDSGLI VYTEGRLADS DMRFSASPQT SAPDVPMVVL 
INGGSASAAE IVAGALQDQQ RAVLMGTESF GKGSVQQVLP LNNGDGLKLT TALYYTPDGR 
SIQAQGIAPD VEVVRGRLEV AEATGLSIRE SDLENHLRNI NGERERTERE SSLAESDYQL 
GEALNLLKAL NVLPRAQSGN