Gene Clim_2093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2093
Symbol
ID	6355071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2308897
End bp	2310138
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	53%
IMG OID	642669688
Product	peptidase U32
Protein accession	YP_001944100
Protein GI	189347571
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAACA ACGCCATGGA ACTCATCTCC CCGGCAGGCG ACTGGACCTG CCTTCGCACC 
GCACTGAACG CCGGAGCCGA TGCCGTCTAT TTCGGCGCTG AAGGCTATAA CATGCGCGCG 
GGCAGCCGCA ATTTCACGCT GGAGGAGTTT CCCGCCGTCA TGGCTCTCTG CAGAGAGTTC 
AGCGCCAAAG GGTATCTGGC GCTGAACACC ATCGTCTATG ACGGGGAGCT GAAAAAGATG 
CATCGAACGG TTTCCGCTGC CAGAGCGGCA GGTATCGACG CCATCATATG CTCGGACATG 
GCCGTCATCG AGAGCTGCCG GAAAATCGGC ATGCCGTTTC ATATTTCGAC CCAGGCTTCG 
GTCAGCAACT ACAGCGCGGT AACGTTCTAT GCCAACCTTG GCGCCAAAAT GGTGGTACTG 
GCAAGAGAGC TGACCATCGA ACAGGTGCGC CATATCACCT CTAAAATAAA AGCGGACAAT 
CTCGACCTGC GCATCGAATG CTTTGTTCAC GGAGCGATGT GCGTCGCCGT TTCAGGCCGC 
TGCTTCATGT CACAGGAGTT GTTCGGGCGA TCAGCCAACC GGGGGCAATG CGTTCAACCC 
TGCAGGAGGC AGTATATCGT CACCGATCCC GAAGAGAACC GCGAACTTGA GCTTGGTTCC 
GACTACGTCA TGAGTCCGCA AGACCTGTGC GCCATAGAAT TTCTCGACGT TCTCATGGAT 
GCAGGAATCG GCGCATTCAA AATCGAAGGA AGAAGCCGCA GTCCCGAATA TGTCCATACC 
GCAACTTCCG CTTACCGGAA CGCCATCGAC TTTTGTACAA CCAACCGGAA CACTCCGGCT 
TTCGGCGATG GATATAATGC TTTATCACAA AAACTTAAAG AAAAACTCGC CCTGGTTTAC 
AACCGGGGAT TTTCGGAAGG ATTTTATTTC GGAAAACCCA TGGATGCATG GACCCGGGAG 
TATGGCTCTC TGGCAGGGGA GAAAAAAATC TACATAGGGG ATGTGAAAAA ATATTATCCG 
AAGGCGGGAG TTGCCGAAAT TATCATCTTT GCCAGAGGAC TCCGCAGCGG TGACAAGCTT 
TCGGTTCTCG GGCCTAAAAC AGGGGTCGCA ACCATCATGG CAGACAGCTT TTTCACCAAC 
GATATACCCT CAGAAGAGGC CGGCAAGGGA GACAGCGTCA CCATTAAATG TGCACAGGTG 
AGAAAAAACG ACAAGGTTTA CGTGCTTGAA AAAAGGAGAT GA

Protein sequence

MQNNAMELIS PAGDWTCLRT ALNAGADAVY FGAEGYNMRA GSRNFTLEEF PAVMALCREF 
SAKGYLALNT IVYDGELKKM HRTVSAARAA GIDAIICSDM AVIESCRKIG MPFHISTQAS 
VSNYSAVTFY ANLGAKMVVL ARELTIEQVR HITSKIKADN LDLRIECFVH GAMCVAVSGR 
CFMSQELFGR SANRGQCVQP CRRQYIVTDP EENRELELGS DYVMSPQDLC AIEFLDVLMD 
AGIGAFKIEG RSRSPEYVHT ATSAYRNAID FCTTNRNTPA FGDGYNALSQ KLKEKLALVY 
NRGFSEGFYF GKPMDAWTRE YGSLAGEKKI YIGDVKKYYP KAGVAEIIIF ARGLRSGDKL 
SVLGPKTGVA TIMADSFFTN DIPSEEAGKG DSVTIKCAQV RKNDKVYVLE KRR