Gene Csal_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1938
Symbol
ID	4025873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2194772
End bp	2195821
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	65%
IMG OID	637967134
Product	putative periplasmic protease
Protein accession	YP_573989
Protein GI	92114061
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0616] Periplasmic serine proteases (ClpP class)
TIGRFAM ID	[TIGR00706] signal peptide peptidase SppA, 36K type

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTGAAT GGATTGCCGA ATATGCGCTG TTCGCCGCCA AGCTGGCGAC GCTGGTCGTG 
GCCGTGGGCG TTCTGGTCGG GCTCGTCGTC ACGCTAAAGC AGCGCGCGAG TGGACAGGCC 
GAAGGCAATC GCCTGCGCAT CGTGGCGCTG CACGAGCGTC AGCGGCGTCG GCGTGAATCG 
CTGCGCCTGG CGGGACTGCC CGCCGCGCAG CGTCGACGGG CCCAGAAAGC GCTACGCAAG 
GAGGAGAAGG CCCGCCGCAA GGGAAAGGGT GAGGCCCAGG AGGCGGCACG ACCACGCGTG 
TGGGTGCTCG ATTTCGATGG CGATCTCAAG GCATCACGCA CGCCGCAGCT GGCGGAGCAG 
GTTTCTCTGC TGCTGGGCGA GTTGCAAGAC GACGACGAGG TCGTCGTGCG CCTGACGTCC 
GGTGGCGGTC TGGTGCATGC CTACGGGCTG GCGTCCGCGC AGCTCGACCG CCTGCGCGAT 
GCCGGTGTGC GACTCACCGT CTGCGTCGAC AAGGTCGCCG CCAGCGGCGG TTACATGATG 
GCCTGCTGCG CACACCGCCT GATTGCTGCC CCGTTTGCCG TGATCGGGTC GATCGGCGTG 
GTGGCTCAGG TACCCAACGT GCATCGACTG CTCAAGAAGC ACGACATCGA TGTCGAGTTG 
CTGACCGCAG GTCGTTACAA GCGGACATTG ACGGTGCTGG GCGAAAACAC CGAGGAGGGG 
CGTGCCAAGT TTCTCGAGGA CTTGCGGGAA ACCCACGACC TGTTCAAGCG TTATGTGGGG 
GAGCGGCGTC CTGCGCTCGA TATCGAGAAG GTGGCGACCG GCGAGATCTG GTATGGACGC 
CAGGCATTGG ATGACGGCCT GATCGATGAG GTGAATACCA GTGACGGCTA TCTGGCGGCA 
CGCATGGAGC AGGCGCGCGT GTTGCAGGTG GTGCTGGAGC CGCGTCATTC CTTGATGCAG 
CGTATCGGTG TCGGCGCTTC GCAGGGCATC GAGCGCTTGA GCGATCGTGT CATGGAACGC 
CTGGAGGAAA GCGGCTGGCA GCGGCGGTAG

Protein sequence

MTEWIAEYAL FAAKLATLVV AVGVLVGLVV TLKQRASGQA EGNRLRIVAL HERQRRRRES 
LRLAGLPAAQ RRRAQKALRK EEKARRKGKG EAQEAARPRV WVLDFDGDLK ASRTPQLAEQ 
VSLLLGELQD DDEVVVRLTS GGGLVHAYGL ASAQLDRLRD AGVRLTVCVD KVAASGGYMM 
ACCAHRLIAA PFAVIGSIGV VAQVPNVHRL LKKHDIDVEL LTAGRYKRTL TVLGENTEEG 
RAKFLEDLRE THDLFKRYVG ERRPALDIEK VATGEIWYGR QALDDGLIDE VNTSDGYLAA 
RMEQARVLQV VLEPRHSLMQ RIGVGASQGI ERLSDRVMER LEESGWQRR