Gene Clim_1498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1498
Symbol
ID	6354814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1610209
End bp	1612401
Gene Length	2193 bp
Protein Length	730 aa
Translation table	11
GC content	52%
IMG OID	642669104
Product	Prolyl oligopeptidase
Protein accession	YP_001943529
Protein GI	189347000
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1770] Protease II
TIGRFAM ID	[TIGR01435] glutamate--cysteine ligase/gamma-glutamylcysteine synthetase, Streptococcus agalactiae type

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTTC GAAAAAGCAC TCTTGCGCTC ACCGTTCTTC TTGTTTTTCC CGGTACAACT 
CCAGCCGCAA ACCGTGTAAA CGGCTTGCCC GATGCGCCAC CGCCTGCGGC AGTAAAACCT 
TTTCAGGAAA AAGTCTGTGA TACAACCATA GTCGATACCT ATCGCTATAT GGAAAAGCTC 
AGCGATCCGG AGGTCACCAG GTGGATGCAG GAGCAATCGG CATACACCCG GAAAGTATTG 
AACAGGATAC CCGGCAGAGA GAAGCTGTTG CATAAAATGC AGGAGTTCGA CGACAGGAAA 
TCAGCAAAGA TCTATAACCT TACCATTACC GAAACCGATC GCTACTTCTA CCTCAAGCAG 
ACTCCTGCGG ATGAGACCGG AAAGCTCTAT TTCCGGGATG GATTTGCCGG ATCGGAAAAC 
CTGCTGTTCG ACCCGTCTGC ATACACGGGA GATAAAAAAG GCAGCTATGT GATCGGCACT 
ATCGCTCCGA ATAATGACGG ATCAAAAGTC GCCTTTACCG TTTATCCGAA CGGTTCTGAA 
AATGCCGCGC TGCTGATCAT GGAAACCGAA AAAGCGCAAC GGTATCCCGA AACCATAAGC 
AGATGCCGTT TTGCTTCGCC CTCATGGCTT CCCGATGGAA CCTCTTTTCT CTACAACCGC 
CTTGAGCCAT CCGGCAAACA GGGAAAAAAT TCTCAGTATG CGAGTAAAAC ATGGCTGCAC 
CGGACCGGAA GCGACCCGTC GACGGATCGT GAGATATTTT CAAGCGCCCT GAATACCGAA 
CTGGATATCA ATCCTGAAGA TATTCCCGAC GTTTCCTACG ACAAGGAGAG CGCTACCCTG 
TTTGCCTTCG TATCGAATGT CGACCGGCGG CTCAAGGTTT ATTACTCACC GGCGTCAGAG 
CTTGAAAAAG AACAGATTAC CTGGAAAAAG CTTTTTGAGC CCGAAGACGA AATCCATGAC 
TTTGCCGTCA GGAATAACGA GCTGTACCTC TACACTCCGA AAAACGCACC GGGCTTCAGG 
GTGCTGAAAA CCTCATTGCA GAACCCCGAT CTGAAAAGGG CGGAAGTGGT TATTCCAGAG 
TTCAGAAATG CGAAACTCAG CGGCATGACG CTTACCAGCA GGGGTATTTT TTATAAACTG 
TCGCTGAACG GCGTACAGGA AGAGCTCTAT CATCTGGAAT ATGGAAGCCT TCTGGCCAGA 
AAGCTCACGC TCCCTTTCCA CGCAGGCACC ATTACGCTCT CGTCGAAAGG GTTCAGATAC 
CCTGAAGTGT GGGCCGTGCT GGCCGGATGG AACCGCGATT ATCGACGCTT CCGTTACGAT 
GCGGAAAGCC GCTCGTTCAT CAATGAAACC CTCTCATCAC CAGCCCAATA TCCTGAATAT 
GGGGATCTTG CCGTGGAGGA ACTGATGGTC CGCTCACAGG ATGGCGTTGC TGTGCCTCTA 
TCGCTCATCT ATAAAAAGGA TCTTCTGAAA AACGGATCGA ATCCCGTGCT GCTCTACAGT 
TACGGAGCAT ACGGACGGTC GATGACACCG TTTTTCAGCC CATCGATGCT GCTCTGGACG 
TGGAAAGGCG GAATTCTTGC GGTTCCGCAT GTGCGGGGAG GAGGCGAACT TGGCGACAAG 
TGGCATACAT CAGGGATGAA AACAACAAAA GCCAACACCT GGAAAGATGC CATCAGTGCG 
GCGGAATTCC TGGTTAAAAA CGGATACACC TCACCCGGCA ACATCGCCAT CAATGGTGCC 
AGTGCCGGCG GAATACTGGT CGGTCGGGCC ATAACCGAAC GGCCCGATCT CTTTGCCGCC 
GCCATTCCTC AGGTAGGGGC AATGAATCCG CTGCGCGCAG AAACAACCGC CAACGGCCCG 
GTCAACGTGC CGGAATTCGG AACGGTTAAA ATTCCTGACG AATGCAGGGC GCTCATTGCC 
ATGGATCCCT ATCTCAATCT TCGTGACGGC GTAAACTACC CTGCCGCGCT CATAACCGCC 
GGAATCAACG ACCCGAGGGT GATTGCCTGG CAACCTGCAA AATTCGCCGC GCGGATGCAG 
GCCGCAACCG CATCTTCGAA ACCGGTGCTC CTGTTCACCG ATTTCGAAGC CGGACACGGT 
ATGGGAAACT CGAAGACAAA AAACTTCGAA GCTCTTGCAG ACGTCCTGAG TTTCGGTCTG 
TGGCAGACAG GACATCCGGA ATTTCGGAAG TAA

Protein sequence

MILRKSTLAL TVLLVFPGTT PAANRVNGLP DAPPPAAVKP FQEKVCDTTI VDTYRYMEKL 
SDPEVTRWMQ EQSAYTRKVL NRIPGREKLL HKMQEFDDRK SAKIYNLTIT ETDRYFYLKQ 
TPADETGKLY FRDGFAGSEN LLFDPSAYTG DKKGSYVIGT IAPNNDGSKV AFTVYPNGSE 
NAALLIMETE KAQRYPETIS RCRFASPSWL PDGTSFLYNR LEPSGKQGKN SQYASKTWLH 
RTGSDPSTDR EIFSSALNTE LDINPEDIPD VSYDKESATL FAFVSNVDRR LKVYYSPASE 
LEKEQITWKK LFEPEDEIHD FAVRNNELYL YTPKNAPGFR VLKTSLQNPD LKRAEVVIPE 
FRNAKLSGMT LTSRGIFYKL SLNGVQEELY HLEYGSLLAR KLTLPFHAGT ITLSSKGFRY 
PEVWAVLAGW NRDYRRFRYD AESRSFINET LSSPAQYPEY GDLAVEELMV RSQDGVAVPL 
SLIYKKDLLK NGSNPVLLYS YGAYGRSMTP FFSPSMLLWT WKGGILAVPH VRGGGELGDK 
WHTSGMKTTK ANTWKDAISA AEFLVKNGYT SPGNIAINGA SAGGILVGRA ITERPDLFAA 
AIPQVGAMNP LRAETTANGP VNVPEFGTVK IPDECRALIA MDPYLNLRDG VNYPAALITA 
GINDPRVIAW QPAKFAARMQ AATASSKPVL LFTDFEAGHG MGNSKTKNFE ALADVLSFGL 
WQTGHPEFRK