Gene Cagg_1721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1721
Symbol
ID	7269427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2105163
End bp	2106503
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	56%
IMG OID	643566563
Product	carboxyl-terminal protease
Protein accession	YP_002463058
Protein GI	219848625
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGGG TGTGGGCAAT TGTTGGTGTC ATCGTTCGGT GGGTCGCCGT GATCGCTGTG 
GCTTTTCTTG GTGGTTGGAT CACCGGGCGG ATTGTTGGCG TCTCTCCGAT CGATGTCTTG 
ATCACCGGTG TCTCTAACGT CGATACGCGA TTGCTCACCC CCGGTGACCG CCGACAACAG 
TTTGCCGTCT TCTGGGACGT GTGGGATTTG GTTGAAGGCA ACTTCTACCA GCCGCAAGCT 
ATCGATCGGC AGAAGATGGT ATACGGTGCG ATCCGTGGTA TGCTGGCAAC GCTCAACGAT 
CCGTATACCT TCTTTCAAGA GCCAGAAGAA GCGCAACAAA ATCGGGAGTC GATGGAGGGC 
CGCTTTGAAG GCATTGGTGC TTATCTGCGG GTTGAAAATG GCCAAATCAT CATCGACCGT 
CCAATCCGGA ATTCGCCTGC CGAACAAGCC GGTATTCAAG CGGGTGACAT CATTCTGGCA 
GTAGATGATC AACCACTGGC CGAGTTAATA GCCGGCTTGA GCGACCAAGA AGCAAGCGCT 
CGTGCAGTAA GCCTTATTCG TGGTCCGGCC GGAACGGTCG TTCGCTTAAC CATTCACCGA 
CCTGCCGAAG ATCGTGTCTT TACCGTTGCC ATCACGCGCG CGGCCATTCC GCTCATCACC 
GTCAATAGCA CGCTCTTACC CGACCGCATT GCCTATATTC AGATTACCGA ATTTAAGGCC 
ACAACCACTG AGTTGCTCGA CCAGGCGATT GCCGAGTTGC TCCCACAACA ACCCCGGGCA 
ATTGTGCTCG ATCTGCGTAA TAATTCGGGC GGTTTTCTGA CTACTGCGCA AGAGGTGCTC 
GGTCGGTTTT ACGACGGCGT GGCGCTCTAT GAAGAAGAGC GTAGTGGCGT CAACAAAGAG 
TTACGCACCA TCACGGCACC GGCTAACCGG CGACTATACG GTATTCCAAT GGTTGTCTTG 
GTGAACGGCG GGTCGGCTAG TGCCGCTGAG GTGGTTGCCG GCGCGCTGCG TGATGTCCGT 
CCGAATACGG TCTTGCTCGG TGAGAAGACC TTTGGCAAGG GGTCGGTTCA GAACATCTAT 
CCCCTGCGTG ACGGGAGCAG TGTGCGCATC ACTATCGCAC GTTGGCTGAC GCCGTCCGGT 
GAAGCGATTA ACGGCGTTGG GATTACACCG GAGCACGTCG TACCGGCCGC GAACGATCCG 
ATCTATCAGG TACCGTGTGT GCCGGACCGA CCCAACGATA CTGGTTGTGC GGATGCGCAA 
TTGTACTGGG CGCTCAAACT GTTACGTGAT GGGACGCCGC CACCACTGCC GGTACCTGTT 
GAAACAGTTA CGGCCCCTTG A

Protein sequence

MERVWAIVGV IVRWVAVIAV AFLGGWITGR IVGVSPIDVL ITGVSNVDTR LLTPGDRRQQ 
FAVFWDVWDL VEGNFYQPQA IDRQKMVYGA IRGMLATLND PYTFFQEPEE AQQNRESMEG 
RFEGIGAYLR VENGQIIIDR PIRNSPAEQA GIQAGDIILA VDDQPLAELI AGLSDQEASA 
RAVSLIRGPA GTVVRLTIHR PAEDRVFTVA ITRAAIPLIT VNSTLLPDRI AYIQITEFKA 
TTTELLDQAI AELLPQQPRA IVLDLRNNSG GFLTTAQEVL GRFYDGVALY EEERSGVNKE 
LRTITAPANR RLYGIPMVVL VNGGSASAAE VVAGALRDVR PNTVLLGEKT FGKGSVQNIY 
PLRDGSSVRI TIARWLTPSG EAINGVGITP EHVVPAANDP IYQVPCVPDR PNDTGCADAQ 
LYWALKLLRD GTPPPLPVPV ETVTAP