Gene Clim_1403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1403
Symbol
ID	6356174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1507907
End bp	1509574
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	51%
IMG OID	642669014
Product	carboxyl-terminal protease
Protein accession	YP_001943442
Protein GI	189346913
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGCA TTTTAACCGT TATAGTAATG GTGGTTGTTC TTGCCTTCGG TGTCTTTCTT 
GGTACCAGAC TGAACCGAGG CGATCATGAC AGAAAAGCTT CCGAAAGCAA AATGGTTGAT 
GCGTACAGCC TGATCAGAGA CCTGTATGTT GATGAAGTGC AGGCAGACAG TCTTGTTGGA 
GCCGGAATCA AGGGAATGGT GGAGTCTCTC GATCCCCATT CGGTTTATCT CGAACCCGAG 
GAGGTTTCGT TTTCGCAGGC CGAATTCGAC GGAAATTTTG ATGGCATAGG CATAGAGTTC 
GACGTTATCA ACGACACGCT GCTTGTCGTA ACGCCTCTTT CGGGTGGGCC GAGTGCTACT 
GTCGGTATTG CTGCCGGTGA TCGTATTGTG GCTATCGATT CGGTTTCGGC AATCGGAATA 
ACGCATCAGC AGGTACTGCG CAAACTCAGA GGGAAACGCG GAACAACAGT GCATCTGAAA 
GTATTTCGTC CACTTGTCGG CAAGCTCATG GATTTTCAGG TTACAAGAGG ACGGATTTCA 
ACCTCGAGTA TCGATGCTTT TTTTGTTCTT CAGAACGGTA CGGGCTATAT CCGGCTGAGC 
CGTTTTGTCG CAACAACCGG CGATGAGTTC CGAAAGGCTC TCGCAAGCCT GAAAAAGAAA 
GGCATGAAGC GCCTTGTCAT CGATTTGCGG GGTAATCCGG GAGGTTTTCT CGAGCAGGCA 
GTCGAAGTTG CCGACGAATT CCTTCGCAAA GACCAGTTGG TCGTTTATAC CAAGAGTGCC 
AAGAATGCCG TTGAAGATGC CAGATATGTA GCCAAGTCCG GCGATGGATT CGAGAGCGGA 
GAGGTTGCGG TACTTGTCGA CAAAGGCAGT GCTTCCGCAT CTGAAATTCT TGCCGGAGCA 
CTGCAGGATA ACAAGCGGGC AGTGATTATC GGAGAGCTTA CCTTTGGAAA GGGGCTTGTT 
CAGCGACAGT TCGAGTTCAG GGATGGTTCC GCCCTGCGAC TTACCGTATC CCGCTATTAC 
ACCCCTTCAG GTCGTCAGAT TCAGAGAACC TATCGCAAGG GAGGCGATGG GCGAGAGCTG 
TATTACAAGG ACGCCCTTGT CAATGTACAA CCCGGGAAAC TGTTTACGGA TCCCGCTCGT 
TTTCTTTACC TTGAAAACAA TGACGTATCC GTTTATCGTA CCGGGACCCT TCCTGCTCTG 
CTTTCGCGTC CTGTTGCCGG TAAGGAATTT CAGGATAATC AGTTTACCCT GCTCAAGGAT 
GCCGGCGGCA TTATACCCGA TTACTGGGTA AGCGGGAGGC CTTATTCCGA TTTCTATCAG 
GAGCTTTACC GAACCGGTTC CTTTGAGCGG CTTGCCCAGA GAATTCTTGA CGATCCCGGC 
AGTTCCGTTC AGGCGCATCG GAAGTCGCTT GGAGCTTTTA TGAAGGATTA TGCCGGAGAA 
AACAGGCTTG AAGCGCTGGT CATGAAGATC TGTGCTGAAA AAAAGATTAC ATTCAACAGA 
CAGGCCTTCA GCAAGGAGCA GAAATATATC TCCCTGGCCG TAAAGGCAAG GCTTGCGCAC 
AGGTTGTTCG GCACGGAAGG GCAGATCATG GTTTATATCA TGCAGTCCGA TCCGCTGATC 
GGCGTGGCTT CGAAAGTTTT TGCTTCAGGA ACTCAATCAG TGCGTTGA

Protein sequence

MSRILTVIVM VVVLAFGVFL GTRLNRGDHD RKASESKMVD AYSLIRDLYV DEVQADSLVG 
AGIKGMVESL DPHSVYLEPE EVSFSQAEFD GNFDGIGIEF DVINDTLLVV TPLSGGPSAT 
VGIAAGDRIV AIDSVSAIGI THQQVLRKLR GKRGTTVHLK VFRPLVGKLM DFQVTRGRIS 
TSSIDAFFVL QNGTGYIRLS RFVATTGDEF RKALASLKKK GMKRLVIDLR GNPGGFLEQA 
VEVADEFLRK DQLVVYTKSA KNAVEDARYV AKSGDGFESG EVAVLVDKGS ASASEILAGA 
LQDNKRAVII GELTFGKGLV QRQFEFRDGS ALRLTVSRYY TPSGRQIQRT YRKGGDGREL 
YYKDALVNVQ PGKLFTDPAR FLYLENNDVS VYRTGTLPAL LSRPVAGKEF QDNQFTLLKD 
AGGIIPDYWV SGRPYSDFYQ ELYRTGSFER LAQRILDDPG SSVQAHRKSL GAFMKDYAGE 
NRLEALVMKI CAEKKITFNR QAFSKEQKYI SLAVKARLAH RLFGTEGQIM VYIMQSDPLI 
GVASKVFASG TQSVR