Gene Cagg_1372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1372
Symbol
ID	7268664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1695572
End bp	1697605
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	57%
IMG OID	643566215
Product	peptidase S9 prolyl oligopeptidase active site domain protein
Protein accession	YP_002462715
Protein GI	219848282
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.330488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.102589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATC CAACCCCTAG TCGCTTCACG ATTGATGATC TCTACGAGCT GGGCTGGCTG 
GAAGATCCGC GTCTTAGCCC CGATGGACAG ACTGCAGCGG TTGTGTGGGT AACGGTTGAC 
CGGGTCAACA ATGGGTATCG GCGGCAGATT GTGTTGGTAC CGACGAATGG CGGTTCACTG 
CGACGCTTTA CACGCGGGAA ACACGATCGT CAGCCGCGCT GGAGCCCAGA TGGAAGATGG 
TTGGCGTTTG TGTCACATCG CGACGATGAA CGCGGCCAAA TCTATCTGAT CCCGGTTGAT 
GGTGGTGAAG CGCGGCAATT AACGGCAATG CCCAATGGCG CCAGCGATCC GGCTTGGAGT 
CCTGATGGTC GGTGGATCGC GTTTTTATCA CCGGTGAGTG TTGACGAACA GGCGCGTGAG 
GATGCCGGTG AGATGCCGTC GCCGCCGGCG GATGCGTGGG AAGCCCGTCG TGCTCGTGAG 
CAGCGTCAGC ACGATGAGGA GCTTCGGATT GATCCACGGG TGGTGACAAA ACTACCGTAT 
CGGAGTGGGA CCAGCTATTT CGATGATCGG TGGCGGCAGG TGTATGTTGT AGAGGTGGAC 
GATGAAGATC GCACCGCCAC ACCTCGCCGG CTTACTTCGG GTGAAATTCA CTACAGTACA 
CCGGTTTGGC TGCCGAACGG TGAAGCACTC CTCAGTACGG CGACGCGCGA TCCGGAAGCC 
GATTCGCTGT TCGCTTATTA CGATGTTGTG CGTATTCCGC TTGATGGATT GCCCCATGCA 
TTGACGAGTC CGGGCTTCTC GTACTTCGAT CCGCAGCCTT CGCCTGATGG CAGCCAGATT 
GCGTTCTTAC GCCTCAATGA AGAGCGATTG CTCGGTGAAG GTCGGCGAGT CGCGATCATT 
CCGGCGGAAG GTGGTGAACC GCACGACCTC ACGGCCCATA CCGATCTGAA CGTTGAACAA 
TTCCGCTGGC AGCCCGACGG TCAGGGGATA CTGTTTAGTG CCGGATGGCG CGGCGATGCT 
CATGTCTATC AGATCGGTCT TCCAGGCACA CCGACCTATC GTAATGGATT GACGTTGGTC 
GGTGGGGCGC GGTTGGTCAG CGAGTTTGAT GTAGGGCGTG ATGGGAGTAT CGTCTTTATT 
GCCGGGAGTG CTGATAATCC GTGCGATCTC TTCTTCCGTA GCGCTGATGG TCACGAGCGA 
CGATTGACAG CGATCAATGA TCGGTTGCTT CAGCAACGGA TTATTGTGCC GATGGAAGAG 
ATGACGTATC TTTCCCCTGA TGGTAGTGAG GTGCAGGGAT GGACGCTGCA TCCACCGGAT 
TTCAATCCGA TGCAGCGTTA TCCGCTTGCG GTGTACATCC ATGGCGGGCC GCATGTGATG 
TGGGGGCCTG GTTTTCGCTC GATGTGGCAT GAATGGCAAG TTGCAGCAGC GCGCGGATAT 
GTGGTCTTCT TCTGTAATCC GCGGGGTAGT GAGGGGTATG GTGAGCTGTG GCGCGATGCA 
ATTCGGCGTA ATTGGGGCGA GGCGGATGCA CCCGATATTC TGGCCGGAAT CGATGCGCTG 
GTGGCACGTG GGTATATCGA TCCCAACCGG ATTGCCGTGA CCGGTGGTTC GTATGGTGGG 
TATATGACGG CCTGGCTGAT CGGGCACGAT GACCGGTTTG CCTGTGCGGT TGCTGCTCGT 
GGCGTATATA ATCTGCTGAC GTTACATGGT ACGAGTGACG CTCACGAGTT GATCGAAATC 
GAGTTTGGTG GGTATCCGTG GGAGTTGTAC GAAGAGTTGT GGGATCATTC ACCATTAGCG 
CACGCACACA AGATCAAAAC GCCGTTGCTG CTCTTGCATA GCGAGCTTGA TTACCGAGTG 
CCGATTAGTG AAGCGGAGCA GCTCTTTGCC ATCCTCCGTC GTCAAAAGAA GGTCGTGGAG 
TTGGTACGGT ATCCGCGCGA AGGTCATGAG CTGACGCGCA GCGGTGAACC ACGTCACCGT 
GCCGATCATA TGCGACGGAC GCTTGAGTGG TTTGATCGGT ATTGTCAGGT GTAG

Protein sequence

MTNPTPSRFT IDDLYELGWL EDPRLSPDGQ TAAVVWVTVD RVNNGYRRQI VLVPTNGGSL 
RRFTRGKHDR QPRWSPDGRW LAFVSHRDDE RGQIYLIPVD GGEARQLTAM PNGASDPAWS 
PDGRWIAFLS PVSVDEQARE DAGEMPSPPA DAWEARRARE QRQHDEELRI DPRVVTKLPY 
RSGTSYFDDR WRQVYVVEVD DEDRTATPRR LTSGEIHYST PVWLPNGEAL LSTATRDPEA 
DSLFAYYDVV RIPLDGLPHA LTSPGFSYFD PQPSPDGSQI AFLRLNEERL LGEGRRVAII 
PAEGGEPHDL TAHTDLNVEQ FRWQPDGQGI LFSAGWRGDA HVYQIGLPGT PTYRNGLTLV 
GGARLVSEFD VGRDGSIVFI AGSADNPCDL FFRSADGHER RLTAINDRLL QQRIIVPMEE 
MTYLSPDGSE VQGWTLHPPD FNPMQRYPLA VYIHGGPHVM WGPGFRSMWH EWQVAAARGY 
VVFFCNPRGS EGYGELWRDA IRRNWGEADA PDILAGIDAL VARGYIDPNR IAVTGGSYGG 
YMTAWLIGHD DRFACAVAAR GVYNLLTLHG TSDAHELIEI EFGGYPWELY EELWDHSPLA 
HAHKIKTPLL LLHSELDYRV PISEAEQLFA ILRRQKKVVE LVRYPREGHE LTRSGEPRHR 
ADHMRRTLEW FDRYCQV