Gene Cagg_0130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0130
Symbol
ID	7266869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	178210
End bp	180024
Gene Length	1815 bp
Protein Length	604 aa
Translation table	11
GC content	55%
IMG OID	643565003
Product	oligoendopeptidase F
Protein accession	YP_002461518
Protein GI	219847085
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR00181] oligoendopeptidase F

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000121565
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000025846
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGACTG TTCGCGAACG CAGTGAGATT CCAGAGCAGT ACAAGTGGGA TCCGTTTAGT 
ATCTTTCCTT CACAGGCTGC ATGGGAAGCG GCCATCGACG AGGTTAATAC GCTCATTGCA 
CGCGCTGCTC AGTTTCGTGG TCGGTTACAC GAAGGCCCAC CCGTTATCGC CGACTTTCTT 
GGCCTGAGCG AGACGATTAT GCGCAACGTC GGCCAAATTA CGGTCTTCGC CACGATGTTC 
TATACCGTCG ATACCAATGA CCGTGAAGCG AGTGCAATGC GTGATCGGGC AATTGGGCTG 
CAAGCCCGAG CAAGTGCAGC ATTGGCGTTT GGTGAGCCTG AGTTGTTGGC CATCGGCGCC 
GATCAGTTGT TGACCTGGGC GGATCAAGAT GAGTATCTGG CAACCTACCG CCACTATTTT 
GAACGCCTGA TCGCTCGTGC TCCTCATGTG CGTTCTGCCG AAGTGGAAGA GTTGTTGGGG 
CAGGTACGCG ATCCGTTCGC TGCGGCAAGT GCAGTCCACG GTGTATTGGC CAATGCTGAA 
TTACGCTTTC CCCTCGCCTA CGACAGCAAT GGTGAGGCGT ATGAGATTAC GCAAGGCACG 
ATTAATGCAC TCATTACCCA TCCTGATCGC ACCTTGCGTA AGCAGGCGTG GGAAGGGTAT 
GCCGACGCGC ACATTGCCGT CGAAAATACG ATGGCCCAGT GCTTAGCCAC CGGCGTCAAA 
CAGAATGTCT TTCTTGCCCG TGCGCGTCGG TATGCCTCGG CTCTTGAAGC CGCACTGAAG 
CCGAATTTTA TTCCACTTGA GGTCTTTCAC AACCTGATCG CTACGTTCGA GCGCCATTTA 
CCGATCTGGC ACCGGTATTG GCGGGTACGT CGTGCGGCCC TCGGTGTTGA TGAATTGCAT 
GTTTACGATA CCAAAGCACC GTTAGCGACC CCGCTTATCG TGCCTTATGA GCGAGCTGTC 
GATTGGATCT GCGCCGGTAT GGCTCCGCTG GGCAATGAAT ATGTCCAGAT TATGCGGCGT 
GGGTTGCGCG AACAGCGTTG GGTTGATGTC TATCCCAATC GGGGTAAGCG GGCCGGTGCG 
TTCTCAACCG GTGCACCGGG CACCCACCCG TTTATTATGA TGTCGTACAA CGATGACATC 
TTCAGCCTTA GTACCCTTGC CCACGAGTTG GGTCACTCGA TGCATTCGTA CTATACGCGG 
CGTACCCAAC CGGTGATCTA TACCAACTAT GGTCTGTTCC TGGCGGAAGT AGCCTCGAAT 
TTCAATCAGG CGTTGGTGCG CGCGTATCTG TTCCAAACGT TAACCGACCG CAATGCCCAG 
ATCGGCTTAA TCGAAGAGGC GATGGCGAAC TTCCATCGCT ATTTCTTCAT TATGCCGACG 
CTGGCTCGCT TTGAGTTGGC TATCCATCAG CGCGCTGAAC GCGGTCAACC GTTAACCGCG 
ACCATCTTTA ACGAGTTGAT GGCCGATCTC TTTGCCGAGG GGTATGGTAG CGAGGTCGTC 
GTTGATCGGG CGCGCGTCGG TAATACGTGG GCGCAGTTTT CTACCCATCT GTACGCCAAT 
TTCTATGTCT ATCAGTATGC AACCGGTATT GCCGGTGCCC ACGCGCTGGC CGCACCTATC 
CTCGCCGGTA ATGCCGATGC CGCCGATCGC TATATCAATG AGTTTCTCAA GGCCGGTGGT 
TCACGCTTTC CACTTGATAC GTTGCGACAG GCCGGGGTTG ATCTAACTTC ACCCGAACCG 
GTTGAGCAGA CCTTTGCCGT GATGGCATCT TACATTGATC GGCTTGAGCA GTTGGTCGGT 
GGATCAGGTT CATAA

Protein sequence

MQTVRERSEI PEQYKWDPFS IFPSQAAWEA AIDEVNTLIA RAAQFRGRLH EGPPVIADFL 
GLSETIMRNV GQITVFATMF YTVDTNDREA SAMRDRAIGL QARASAALAF GEPELLAIGA 
DQLLTWADQD EYLATYRHYF ERLIARAPHV RSAEVEELLG QVRDPFAAAS AVHGVLANAE 
LRFPLAYDSN GEAYEITQGT INALITHPDR TLRKQAWEGY ADAHIAVENT MAQCLATGVK 
QNVFLARARR YASALEAALK PNFIPLEVFH NLIATFERHL PIWHRYWRVR RAALGVDELH 
VYDTKAPLAT PLIVPYERAV DWICAGMAPL GNEYVQIMRR GLREQRWVDV YPNRGKRAGA 
FSTGAPGTHP FIMMSYNDDI FSLSTLAHEL GHSMHSYYTR RTQPVIYTNY GLFLAEVASN 
FNQALVRAYL FQTLTDRNAQ IGLIEEAMAN FHRYFFIMPT LARFELAIHQ RAERGQPLTA 
TIFNELMADL FAEGYGSEVV VDRARVGNTW AQFSTHLYAN FYVYQYATGI AGAHALAAPI 
LAGNADAADR YINEFLKAGG SRFPLDTLRQ AGVDLTSPEP VEQTFAVMAS YIDRLEQLVG 
GSGS