Gene Cagg_2866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2866
Symbol
ID	7267574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3519664
End bp	3520836
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	58%
IMG OID	643567689
Product	GCN5-related N-acetyltransferase
Protein accession	YP_002464164
Protein GI	219849731
COG category	[R] General function prediction only
COG ID	[COG4552] Predicted acetyltransferase involved in intracellular survival and related acetyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAACCT ACCGACCACT TACCCCAACC GATTTCGAGC AATTCTGGGC GCTAGATAGC 
TACGCTTTTG CCCGTCAATA TCACCGTAGC CGTTACACAC CGGAGGTAAT CGCGCAACTG 
CGCGGCTTGT TCGTACATGG CGAGCATGTT GCGCAATTGC AGATTATGCC GTTCCAGATG 
CAGGCCGGCC ACGGCGAGTT GCCGGTTGGC GCGCTGGGAA GTGTGGCAAC CTGGCCGCAG 
CACCGACGCC GTGGGTACGC TCAGCGTCTG TTGCGCGCTG CTTGCGATGA ACTGCGCGAA 
CGTGGTGCAG TGTTGGCGTT GCTGTATCCC TTTCACGCCG ATTTCTATCA TCGGTTGGGG 
TGGGCATTGG CCGGCGAACG GCGGCTGGTG CAACCCACAC CGGCTCATTT GCGTGCCTTT 
ACCCCCGCCC CCGGTAGCTA TCATCCGGTC GGCGTTGACC AGATCGAAGA GCTTGACGCT 
ATCTATCGCG GTGCCTTGCG TGGACGTTAT GGCCTCCTCG TGCGCGACCG CACATGGTGG 
CAGATCGATG TGTTACAAAC ATGGGACGGT GAACCGTATT CCGCCTATAT CTGGCGTGAT 
GAACATAGTA ACGGGCGTTC GTACCTGATT TACCGCCTCG AACGGAGGAG CGACGGTGAT 
CGCCTCGTCT GCCGCGATAT TGTCGCGCTC GACCCGCTCG CACGCGCGCA ACTCTTTGTC 
TTTATCGCGT CGCACGCCGA CCAGATCGTC GCCGCCGAGA TTACCACCCC TATCGATGCT 
CCACTAAATG CACTGTTGCC AGCTCCTGCG CCGACAACGG TGGTACCATT GTTTATGCAA 
CGAGTACTCG ATGTGACCCG CTTGTTAAGT CTGTATCCCT TTGCTACGGT CAATGGTCGG 
CTGCGTATCC AAGTTGCCGA TGACTGGCTC AACGACAATG CCGGTTGCTA CCAGATTGAA 
TGGTACGACG GCCAAACAAC CGTCAGTCGT CTCGACCACG ATACTGTCGA TCTCGCCTGC 
ACCAGCGGTA CCCTCGGTCA GCTCCTCAGT CGCTACCTGC GCCCACGCAC CGCCGCCGCT 
TTTGGCTTGC TCACCGTATA CCAACGCGCA GCCTTGACCC TCCTCGAACA GACACTGGCC 
GGCCTACCAC CGTTTTGTGG TGACTATTGG TGA

Protein sequence

MITYRPLTPT DFEQFWALDS YAFARQYHRS RYTPEVIAQL RGLFVHGEHV AQLQIMPFQM 
QAGHGELPVG ALGSVATWPQ HRRRGYAQRL LRAACDELRE RGAVLALLYP FHADFYHRLG 
WALAGERRLV QPTPAHLRAF TPAPGSYHPV GVDQIEELDA IYRGALRGRY GLLVRDRTWW 
QIDVLQTWDG EPYSAYIWRD EHSNGRSYLI YRLERRSDGD RLVCRDIVAL DPLARAQLFV 
FIASHADQIV AAEITTPIDA PLNALLPAPA PTTVVPLFMQ RVLDVTRLLS LYPFATVNGR 
LRIQVADDWL NDNAGCYQIE WYDGQTTVSR LDHDTVDLAC TSGTLGQLLS RYLRPRTAAA 
FGLLTVYQRA ALTLLEQTLA GLPPFCGDYW