Gene Cagg_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1734
Symbol
ID	7269440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2119935
End bp	2121140
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	57%
IMG OID	643566576
Product	type II secretion system protein E
Protein accession	YP_002463071
Protein GI	219848638
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.494543
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAAACCT TATGGGACAC TAGAGTGCAG TCGGTGCCAT CACCGGCTAC CGGTGCAGCC 
ATCACGGAAG AATTACGGAT GTTGCTGCGC AGCGGTCGTC TGCGCGATTG CTGGCACTTA 
CCACCTGATG AGGCGTTTGC TCGGCTCGGA TTCGATGACT CGGTGCCATG GCGCGATGTG 
GCATGGTACG GTCCTATCGA GATTTGGCGT GATCCTGAGC ATGCGGTGTC AGACATTCTA 
TTTAACGGTC CGTCCGATTC GCCCTTTTTT GTGGTGCAGC GCGGCATGAT GGTCAATACC 
GGTGTAATCG TCCACCCGGC CTGGATCGAT TGGACGCAAC GTCAGTTGGT GCTACGTAGT 
CACGGTGTGA TCGGCGATGC TCCACTGCCG GCATTCGTCC AAGGCGTTGT TGACAGGTTG 
CGCTATGCCA TAACGAACCG ACGCGCTTCC CCATCTGGAC CGAGTCTGGC GATTCGCTTA 
CTGCCCGAAC GGTGGGCAAC ACTCGACGAT CTTGTGCAGA GCAACGTCAT TAGTCGGGAA 
GCCGGTGAAC TCTTATTGGC GGCTCTTAAC GGTGGTGCAT CAGTGCTGAT TGCCGGTCCG 
ACCGGTAGTG GAAAGACAAC ACTAGCCGCC GCGTTGACCC AGGCGATTGG CACACGTATG 
CGCTTGGTCG TCATTGAAGA TGGTGGGGAG CTGCCCCATA GCGCCAATAG TTTACATATT 
GAAGCACCGG CTGAAACCGG TGGTTTTAGC CGTGCTGTGA CCTTTGCCCT TCGCCAAAAG 
CCCAACTACA TCATCGTTGG TGAGGTACGT GGTGGCGAGG CAATGGCGAT GTTACAAGCG 
GCCGCAACCG GTCATCCCGG TTTAGGCACC ATTCACGCGG CGACGGTACA AGGAGCGTTA 
CGAAACCTTG AGCGGATGGC GCTGATCGGC TTGGCCCATG AGACAACCGG TGCCGGGCAG 
GCAGCAGCTC AGATCGTGCG CGGTTTGATC ACCTCTGATG TCGTGAACCT GTTGGTAGTC 
CAGATCGGAC GTGCTCCTAA TGGGAAGCGT GGTGTGATGG CCATCGAAGA GGTGTTACCC 
CAAGGCTCAC AAGGTCAGAG TGGTGATCCT TTCCCAACAA ACCCACTTTT TCGTTATGAA 
CGGACGAGTG AACAGTTGGT ACGGGCCGGC TATGTTAATG CAGGGTGGGG ATTGGGTCGG 
ATGTAA

Protein sequence

MQTLWDTRVQ SVPSPATGAA ITEELRMLLR SGRLRDCWHL PPDEAFARLG FDDSVPWRDV 
AWYGPIEIWR DPEHAVSDIL FNGPSDSPFF VVQRGMMVNT GVIVHPAWID WTQRQLVLRS 
HGVIGDAPLP AFVQGVVDRL RYAITNRRAS PSGPSLAIRL LPERWATLDD LVQSNVISRE 
AGELLLAALN GGASVLIAGP TGSGKTTLAA ALTQAIGTRM RLVVIEDGGE LPHSANSLHI 
EAPAETGGFS RAVTFALRQK PNYIIVGEVR GGEAMAMLQA AATGHPGLGT IHAATVQGAL 
RNLERMALIG LAHETTGAGQ AAAQIVRGLI TSDVVNLLVV QIGRAPNGKR GVMAIEEVLP 
QGSQGQSGDP FPTNPLFRYE RTSEQLVRAG YVNAGWGLGR M