Gene Cagg_0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0159
Symbol
ID	7269626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	209510
End bp	210562
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	58%
IMG OID	643565031
Product	SH3 type 3 domain protein
Protein accession	YP_002461546
Protein GI	219847113
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.333454
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0117135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACG AACCACAACC GAATCAATCA TCACCTGAAC CATCACCAAC GTCACGCGAG 
ACTCGTCGGC TCACCGCACC GCGGTTACCA CGCGCTGCCG AGCCTAAAGC GTCACGCACG 
CCTTCACCGA GTGAGATTGA TGAGTTGATC AATGCACTTG GTGATCCGAA TCATCCACGT 
CACACGGTTG CCGTTGATGA ATTGGTCGCG ATTGGGCCTG CTGCCGTTCC GGCGCTCTGT 
GCCGTTGTTG GACCACATCA GCCGTGGTTG ACGGTCTACC GCGCGACCGA AGTGCTCGCC 
CAGATCGGTG ATGGTCGCGC GACCGGCCCT TTGATTGCGG CCCTGAACCA TCAAAACGCG 
AATGTCCGCT GGGGGGCCGT GCGCGCACTC GCGCAAGTCG GTGATGTGCG GGCACTGTTT 
GCGCTCCGCA AAGTTGTCCA GACCGATCAG GGTCGTACCA GTTGGGGCGA ATCGGTTGCC 
GGAGTAGCTC AGAGTGCGCT TGATCTGCTG AATCGGCGCA GTATTTGGTC GCAGAGTCTT 
GAATTGATCA AACTAGCGAT TGTGAGTGTG ATCTTCTTAC TCTCGATGGC GCTGGCCTTC 
GGCGTGATCG GCACGCTCCG CAATGAACTT GATCAATTTG GGCGCTACGT ACCAGGCCAA 
ACCGAATTGC CGACCCTGGT CTTGCCGACC ACACGACCCA CCGCAACCCC GCGCCCGACG 
CTTGCTGCCA ATCAAACAGT GGGTCCGCAG CCGACGACAC AGGTTATCAC CGGTACGGCA 
CTGCAAGTGG CGAATGTGCG ACCGCTTCCC GGTACGAATA ACCAACCGAT TGGACGCATT 
AACGCCGGTG ATGAGATTAT CTTTATTGCC CGCACTGCCA ACGGTCAGTG GTATCTGATC 
CGACTCGGTA ATCAGCGGAG TCCCGACTCG TTTATCGCCA ATCCTGATGG TAGCGGGACG 
GGGTGGGTTA ATCAGGCGTT GGTGTCGCCG CCATCGGCTG ATGTGCCGGT GCAAGAGCCG 
TTGCCGGTTA CCGTGCCGAC AGCAACCCCA TAA

Protein sequence

MTNEPQPNQS SPEPSPTSRE TRRLTAPRLP RAAEPKASRT PSPSEIDELI NALGDPNHPR 
HTVAVDELVA IGPAAVPALC AVVGPHQPWL TVYRATEVLA QIGDGRATGP LIAALNHQNA 
NVRWGAVRAL AQVGDVRALF ALRKVVQTDQ GRTSWGESVA GVAQSALDLL NRRSIWSQSL 
ELIKLAIVSV IFLLSMALAF GVIGTLRNEL DQFGRYVPGQ TELPTLVLPT TRPTATPRPT 
LAANQTVGPQ PTTQVITGTA LQVANVRPLP GTNNQPIGRI NAGDEIIFIA RTANGQWYLI 
RLGNQRSPDS FIANPDGSGT GWVNQALVSP PSADVPVQEP LPVTVPTATP