Gene Clim_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0020
Symbol
ID	6354934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	23941
End bp	25638
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	52%
IMG OID	642667644
Product	carboxyl-terminal protease
Protein accession	YP_001942107
Protein GI	189345578
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCAG TATCATTCCG CAGGCATGTT GTCGCAGGAC TGACAGCGGC ACTCCTTGCT 
CTCTCTTTGC CGGGATCTCA TCTGCAGGCC GTTCCCAAGG AGAACCCCGG GCAGGCATAC 
TTTGAAATAG TAAAAGGCAT AGATCTGCTT GGCGAGGTAT ACCGCAGACT TTCCGAAAAC 
TATGTAGAAC CGATTGACGC AGTTAAACTC ATGTATGCCG CCATTGACGG CATGCTTGCG 
GTTCTTGATC CCTATACGGT ATTTCTCGAT GAGAGTCAGT CCGAAGAGCT TGGTGAAATG 
ACCAGTGGAC AGTACACCGG CATAGGACTC AATATGAGCA GATTCGTTGA AAAAGTCTAT 
ATAACATCGG TACTTGAAGG CTATCCCGCA TGGAAAGCCG GAATCAGGAC TGGCGACAGG 
ATTGTCCGGA TCAACGGCAA TTTCGTTACA GGAAAGAATC TCGATGAGAT CAGGGCGATG 
ATGAAAGGGG GAACCGGGAC GCCGCTTATG ATGAAAATCG AGCGGGAAGG AGGTCGGGAT 
CCAGGGATCA TTACCCTTTC GAGAGAGGAA GTCAGGGCCG GAACGGTGCC CTATTCCGGT 
ATCATCGGAC AAACCGGCTA TCTGGAGATC AGCAGCTTTT CAAGTCATTC AACTGAAGAT 
ATCCGTCTGG CAGTTGAAAA ACTGCTTCGT CAATCCGCAG AGAGCCGACA GCCGATGAAC 
GGTCTGATTA TCGATCTTCG CGGTAATCCC GGCGGTCTGC TTTCGGCTGC GGTTGAAATA 
TCTTCTCTGT TTATGGAGAA AGGCAGTACG GTCGTCACCA TAAGGGGGCG ATCTCCGGAA 
TCAGAGAAAA TCTATAAAAC GGAACAGCTC CCCATCGCCG AAGCGTTTCC GATTGCCGTA 
CTGATCAACC GGGAGAGCGC ATCCGCATCC GAAATAATAT CGGGGGCCGT TCAGGATCTG 
GATCGCGGAG TCGTTATCGG AGAACGCTCA TACGGGAAGG GTCTGGTACA GTCCGTTATA 
CGACTGCCCT ACGACAATAC CCTGAAAGTC ACGACGGCAA AATACTATAC CCCTTCCGGT 
CGTTTGATCC AGAAGCCGCA TGCCGATAGC GGTACGGCAA GAAATGTCCT GATGAAAAAC 
GATGACCGCA AGGCTCTGCC GGTCTATTAC ACGGCAGGAA AACGTAAGGT ATACGGCGGC 
GGTGGTATTG CACCCGATAT GACTGTGGCG GATATTTCGC GATCAGAATA CGAACAGGAG 
CTTCGACGCA GGGGTATGAT TTTTTTGTTT GCTGCCCGGT ACCGGGCTTT GCACCCCGAT 
GCTGTTCGGC AACCGCTCGA CCGCGCAGTG CTTATTGACG AATTCGCGTT CTTTCTCCGT 
CAGCAGGGCT TTTCATTCAC TTCAGCTCCG GAACGGCATC TCAAGGAACT TGAAGAGAGT 
ATAGCTGAAG AGCAGGGGGA TAAAAAAGCA GCAGGGCCCG AAAGTATTCC GGGATTGAAA 
CAGGAACTCG CAAGAATGAA ACAGAAGCGC GTCGACGGAG AGTCGGAGCG GATTGCCCGG 
CTGCTTGAAC TTGAAATCAT GCGCCATGGC GACGAAAATG CATCGCGCAG GGCAGCGCTC 
GGCGACGATC CTGTTGTGCA GAAAGCCCTG GCTCTGCTTG CCGACCCGAA AGCCTATTCA 
AGGCAGCTCA AGCCCTGA

Protein sequence

MKPVSFRRHV VAGLTAALLA LSLPGSHLQA VPKENPGQAY FEIVKGIDLL GEVYRRLSEN 
YVEPIDAVKL MYAAIDGMLA VLDPYTVFLD ESQSEELGEM TSGQYTGIGL NMSRFVEKVY 
ITSVLEGYPA WKAGIRTGDR IVRINGNFVT GKNLDEIRAM MKGGTGTPLM MKIEREGGRD 
PGIITLSREE VRAGTVPYSG IIGQTGYLEI SSFSSHSTED IRLAVEKLLR QSAESRQPMN 
GLIIDLRGNP GGLLSAAVEI SSLFMEKGST VVTIRGRSPE SEKIYKTEQL PIAEAFPIAV 
LINRESASAS EIISGAVQDL DRGVVIGERS YGKGLVQSVI RLPYDNTLKV TTAKYYTPSG 
RLIQKPHADS GTARNVLMKN DDRKALPVYY TAGKRKVYGG GGIAPDMTVA DISRSEYEQE 
LRRRGMIFLF AARYRALHPD AVRQPLDRAV LIDEFAFFLR QQGFSFTSAP ERHLKELEES 
IAEEQGDKKA AGPESIPGLK QELARMKQKR VDGESERIAR LLELEIMRHG DENASRRAAL 
GDDPVVQKAL ALLADPKAYS RQLKP