Gene Cagg_1546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1546
Symbol
ID	7267323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1892854
End bp	1894140
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	57%
IMG OID	643566388
Product	glycosyl transferase group 1
Protein accession	YP_002462884
Protein GI	219848451
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGTAG TTCACGTTAG TACGAACGAC ATCAGCGGTG GTGCGGCACG GGCAGCGTAT 
CGGCTCCATC AGGGCTTATT GCAGTTGGGG TGTGATTCAC GAATGGTGGT TGCCCATCGG 
TGGAGTGATG ATCCGACGGT GCAGGAGTTG GCGTCGAAAC CCGTTCTCAT CGGTACGTGG 
CAACGACGTT GGCGTGGTTG GCGGATCCGA CGCGATATGC AACCGTACCT CACAACCCGC 
CCGCCCGGCC TCGAACCATT CAGCGATGAT CGCAGTCGGT ATGGGTACGA ATTACCAAGA 
GCATTGCCGG CTTGCGATGT GGTCACTTTA CATTGGGTTG CCGGTTTGCT CGATTACGGC 
AGCTTCTTTC GGACCGTACC GCAACGAGTA CCGGTCGTGT GGCGGCTTTC CGACCAGCAG 
CCCTTTACCG GCGGTTGCCA TTACGATGAA GGCTGTGGAC GCTACACGGC GACCTGTGGG 
GCATGTCCGC AGCTCGGTTC GCGCGATGAT CACGATCTTT CCCACCGGAT TTGGTTACGC 
AAACGGGCTG CCCTCGCTGC CGTGCCACCC GGTCATCTCC ACATCGTTGC GCTCAACCGT 
TGGATGGCTG CCGAAGTACA CCGTAGCTCG CTGTTCGGGC ATTTACCGGT GCATATCATT 
CCTAACGGTC TTGATACCAC CGTCTTTGCA CCGTATGATC GGGCCTACGC GCGGGCAATA 
CTCGGCTTAC CCCAGCAAGC AAAGATCGTC CTGTTTGTCG CGGTTTCGGT CAATAATCGT 
CGGAAAGGAT TTGCTCAATT AGCAGCGGCA TTGGCCGGTC TGTATGATGA ACCCGACTTA 
TTGCTGGTCT CGGTCGGTAA ACATCCGCCT ACCCTGAATA TCCCCATCGC GCATCATCCT 
CTCGGTACGG TTGATGAAGA TACCCGGCTC GCCTTAGCTT ATAGCGCTGC TGATCTTTTT 
GTTATTCCGT CGTTGCAAGA CAATATGCCG AGTACGGTGC TCGAAGCACT GGCATGTGGC 
ACGCCGGTCG TCGGTTTTGA TACCGGTGGT ATTAGCGAAT TGGTGCGCCC CGGCCAAACC 
GGTTGGTTGG CGCCGGTCGG TGATGTCGAC GGGTTGCGTG AGGCCATTCG GCATGCGCTC 
CACAACGATG ATGAGCGCGT ATGGTTGGGA CGCCGCTGCC GAGAAATTGC CCTTGCTGAG 
TATCGGCAAG AAATACAGGC GCAACGCTAT CTCGACCTCT ATCAACAAAT TACGACTACC 
GCCAATGCTA CAGTACGGGT GGGATGA

Protein sequence

MRVVHVSTND ISGGAARAAY RLHQGLLQLG CDSRMVVAHR WSDDPTVQEL ASKPVLIGTW 
QRRWRGWRIR RDMQPYLTTR PPGLEPFSDD RSRYGYELPR ALPACDVVTL HWVAGLLDYG 
SFFRTVPQRV PVVWRLSDQQ PFTGGCHYDE GCGRYTATCG ACPQLGSRDD HDLSHRIWLR 
KRAALAAVPP GHLHIVALNR WMAAEVHRSS LFGHLPVHII PNGLDTTVFA PYDRAYARAI 
LGLPQQAKIV LFVAVSVNNR RKGFAQLAAA LAGLYDEPDL LLVSVGKHPP TLNIPIAHHP 
LGTVDEDTRL ALAYSAADLF VIPSLQDNMP STVLEALACG TPVVGFDTGG ISELVRPGQT 
GWLAPVGDVD GLREAIRHAL HNDDERVWLG RRCREIALAE YRQEIQAQRY LDLYQQITTT 
ANATVRVG