Gene Cagg_1310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1310
Symbol
ID	7268601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1610346
End bp	1612154
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	58%
IMG OID	643566153
Product	oligoendopeptidase F
Protein accession	YP_002462654
Protein GI	219848221
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR00181] oligoendopeptidase F

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0118183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000404795
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCTTAT CTGCGAACAG TATTCCCACA CGGGCCGAAA TACCGGTCGA ATATACGTGG 
GATCTATCTC AAATCTTTGC CGATGTCCCC GCGTGGGAAC AAGAACGTAG CGCGGTTGAA 
GCGCGTGCGC AAGAGTTAGC CGCCTTGCAA GGGACGCTGG CGCAGGGGCC GGCGCAGTTG 
CTGGCAGCAT TGACGTTACG TGATGAGGTG GCGCAGCGAC TGCATGCGTT GTATGTCTAT 
GCTCTCCATC GCAAGGATAG CGATGGTACC GATCCGGTAG GGCAGGGTTT GGCCGAGCGG 
GCCGGTAGTT TTGCGGCTCG GATACAAGCG GTGCTGGCGT TTATTGAGCC AGAGATTTTG 
ACGATCCCGG CGGAAACGCT GGACGAGTGG TTGGCGGCTA CCCCCGGCTT GCAAGTGTAT 
CGCTATGCCT TAGAGAAGCT GAACCGCCAG CGGGCGCATA TCCGCTCGGC TGAGGTTGAG 
CAGGTGATGG CAGCGTTGAG CGATATTGTC CGTGCGCCAT ACGCTACGTT CTCGATGTTG 
ACCGACGCGG ATTTGCAATT TCCGACAATT GAGGATGAGC AGGGTCAGCC GGTGAAGTTG 
TCACATGCGC GCTATGGTCG TTTGCTCGAA AGCCATGACC GGCGGGTGCG GCGTGATGCG 
TTCAAGGGGT ACTACAGCGC GTTTTTGCCC TTCCGTAACA CGCTTGCCAC CACTCTCGGC 
GCGGCGATCC GCTCGCACGT GATCGAGGCC CGGTTGCGCA ATTACGGATC GGCGCTAGAG 
GCGGCGCTTG CTCCGAATGA AATTCCTGTC GAGGTGTACC ATAACCTGAT CGCGACCGTT 
GAGGCTAATT TGCCGCGGTT TCATCGCTAT TTGACCGTGC GGCGACGCCT CATGGGTTTA 
GATGACTTGC ATTTCTACGA TCTCTATGTG CAGCCAGTGC CCGATGTGGA AATGACCATT 
CCCTACCGTG AGGCGTGTGA TCTGATGCGT GAGGCGTTCC GTCCGCTCGG CCCTGAGTAT 
GGTGCGGCGC TCGATCAGAT GTTTACGCGG CGTTGGATCG ATGTGTATGA GAATGTGGGG 
AAGCGGAGTG GTGCCTATAG CGGCGGTTCG TATGGGACGC CGCCCTACAT CTTGCTCAAC 
TACCAAGACC GGCTGCGTGA TGTCTTTACC CTCGCCCACG AATTGGGCCA CTCGCTTCAT 
TCGTACTTCA CCCGCGCCAC TCAGCCGTTC GTCTATGGCG AGTACACCAT CTTCGTCGCC 
GAAGTGGCTT CGACGCTCAA CGAGGCGCTG CTGACCCACT ACATGTTGCA AAGCGGTGCT 
GATGAGGCGT TGCGGCGGCG GTTGCTGGCC CAGCAGATCG AAGAGATTCG CGGTACTATC 
TTCCGCCAGA CGATGTTTGC CGCCTTCGAG CTGTGGATGC ATGAGCAAGC CGAGCGTGGT 
CAACCTCTCA CGGCTGATGC GCTGAGCCAG CATTACCGTG AGTTGGTTGT GCGGTATCAC 
GGACCTGAGT TGGTGATCGA TGATGAGCTG GCGTATGAGT GGCTGCGCAT TCCGCACTTC 
TACTATCAGT TCTACGTGTA TCAGTATGCG ACCGGCTTGT CGGCAGCCCT GGCGCTGAGC 
CGCCAGATTA TCAACGAGGG CCAGCCGGCG GTTGAACGGT ATCTGCGGTT CTTGCGCAGC 
GGTTCGTCGC GGTCGTCAAT CGATCTGCTG CGCGACGCCG GTGTTGATAT GACCTCGCCG 
GCGCCGATTC AGGCCGCGAT GGATACGTTT GCTGAATTGG TCAGCCAATT GGAACAGTTG 
GCACCGTAA

Protein sequence

MTLSANSIPT RAEIPVEYTW DLSQIFADVP AWEQERSAVE ARAQELAALQ GTLAQGPAQL 
LAALTLRDEV AQRLHALYVY ALHRKDSDGT DPVGQGLAER AGSFAARIQA VLAFIEPEIL 
TIPAETLDEW LAATPGLQVY RYALEKLNRQ RAHIRSAEVE QVMAALSDIV RAPYATFSML 
TDADLQFPTI EDEQGQPVKL SHARYGRLLE SHDRRVRRDA FKGYYSAFLP FRNTLATTLG 
AAIRSHVIEA RLRNYGSALE AALAPNEIPV EVYHNLIATV EANLPRFHRY LTVRRRLMGL 
DDLHFYDLYV QPVPDVEMTI PYREACDLMR EAFRPLGPEY GAALDQMFTR RWIDVYENVG 
KRSGAYSGGS YGTPPYILLN YQDRLRDVFT LAHELGHSLH SYFTRATQPF VYGEYTIFVA 
EVASTLNEAL LTHYMLQSGA DEALRRRLLA QQIEEIRGTI FRQTMFAAFE LWMHEQAERG 
QPLTADALSQ HYRELVVRYH GPELVIDDEL AYEWLRIPHF YYQFYVYQYA TGLSAALALS 
RQIINEGQPA VERYLRFLRS GSSRSSIDLL RDAGVDMTSP APIQAAMDTF AELVSQLEQL 
AP