Gene Cagg_0002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0002
Symbol
ID	7268998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1767
End bp	3164
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	55%
IMG OID	643564874
Product	peptidase S41
Protein accession	YP_002461391
Protein GI	219846958
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.220655
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000027007
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTCATA GACATATTCT CCTCATGCTA TTGGCCGCGA TCATTATGAG CGGCTGTACC 
TTTGGGCAGA ACCCCGCAGA ACCTGCCCTT ACCGGTGCTC GACCGGCAGC ACCGGCAACT 
CGTATTCCTT TACCAAGCCC TTTACCAAGT GCCACGCCGG CTCCTACAGC ATCAGATCTC 
GCGCGGACAC CAACCCCTAC ACCTCCGATT GGAACGATTG TTCCTACACC AACACTGGCT 
CCACTCAGTC GTGAACAACG TCTGCAAATC TTTCAGCAAG TCTGGGAAAA GGTACGCGAC 
AACTATGTGT ACCCTGACTA CAACGGACTA GACTGGCAGG CAATTCGGGA AGAGCTACGA 
CCAAAAGTTG CTGCTGCTGT AACCCCGGAA GAGTTCTACA GCATCATGCG CGAGATGATT 
GCCCGGTTGG GTGACGACCA CTCGCGCTTC GAGTCTCCGC AAGAAGTTGC TGCCCAGCTT 
GCCGAGGCCA GTGGTCAACT ACAATACGGC GGCATTGGTG TGAGTGTGCG AACCATTGAT 
GAAGGCGGCC TCATCACCCG CGTGGTGCCC GGTGGGCCGG CAGACCAGGC TGGTATTCTT 
ACGCGCGATA TTATTGTGGC CGTTAATGGC ATTCCGTTCA ACGATCCCAA CGCATTCGGT 
CCAGATGGTG CAATTGGGGC AGTCCGTGGC ATTCCCGGTA CGAGTGTCCG GCTGACGATA 
AAGCGCGGCA ACGAGCCGTT ACGAGAGATT GAAGTTGTCC GAGCGGTAAT CGACATTGCC 
GTGTTCAATC GAGTTACTGT CGAACGGCTC GCCGGTGACG TTGGCTTGCT CACCATCCCT 
AGCTTCTACG TCGACAATGC CGACAGCCAG GCACGTGACG CCCTGACTAA TCTGTTAGCA 
GCGGGGCCGG TACGCGGGAT GATTATTGAT GTCCGTGATA ACAGTGGCGG CTATATTCAT 
ATCATGCGCA ACATTATCGC CCTCTTTCAC GACGGAGGCA GTATCGGCAC GTCGGTAGGT 
CGTAACGAGC GTGAAGAACA GCGCATTCCA CGTGGAAAAA CGATCGCGGG TCTGATCGAC 
ATCCCGATTG TAGTACTTAT CAGTGAAGAG ACGGCCAGTG CCGCCGAGAT GTTTGCCGCC 
GGGATGCGGG TTTTGTGTCA AGCGACGATT GTTGGTGTAC CATCGGCGGG GAATACCGAA 
AACCTGTACG GCTACAACTT CGATGATGGC TCACGGCTTC TCCTGGCTGA AGTCGCCTAC 
CAACTTCCCG ACGGTACCCT GATCGAGGGA ACCGGTGTTG TCCCTGATGT CCTGATCGAA 
GCGGAATGGT GGCGCTTCCC GCGTGAACAA GACCCACAAC TGCAAGCCGC ACTAGCCATT 
ATTCAAAAAC CATCGTAG

Protein sequence

MRHRHILLML LAAIIMSGCT FGQNPAEPAL TGARPAAPAT RIPLPSPLPS ATPAPTASDL 
ARTPTPTPPI GTIVPTPTLA PLSREQRLQI FQQVWEKVRD NYVYPDYNGL DWQAIREELR 
PKVAAAVTPE EFYSIMREMI ARLGDDHSRF ESPQEVAAQL AEASGQLQYG GIGVSVRTID 
EGGLITRVVP GGPADQAGIL TRDIIVAVNG IPFNDPNAFG PDGAIGAVRG IPGTSVRLTI 
KRGNEPLREI EVVRAVIDIA VFNRVTVERL AGDVGLLTIP SFYVDNADSQ ARDALTNLLA 
AGPVRGMIID VRDNSGGYIH IMRNIIALFH DGGSIGTSVG RNEREEQRIP RGKTIAGLID 
IPIVVLISEE TASAAEMFAA GMRVLCQATI VGVPSAGNTE NLYGYNFDDG SRLLLAEVAY 
QLPDGTLIEG TGVVPDVLIE AEWWRFPREQ DPQLQAALAI IQKPS