Gene Cagg_2374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2374
Symbol
ID	7268724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2883780
End bp	2884781
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	56%
IMG OID	643567199
Product	glycosyl transferase family 2
Protein accession	YP_002463684
Protein GI	219849251
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATC TATCACCAAC GGTCAGTATC GTCATTCCTA CCTACAATCG CTGTGATCGT 
TTACAGCGAG TGTTAGCGGC GCTTGCTAAG CAGACGTACC CGCATACATC GTTTGAAGTC 
GTGATCGTCT CTGACGGATC GACCGACGGT ACTGCGGCAT TCTGCCAATA TGCCCAAACA 
CCGTTTCACT TGCAGTTTAT TCAGCAAGCC AACGCCGGGC CGGCAGCAGC GCGCAATCGG 
GGGGTTGCCG CGGCTCGTGG CACGATCATT TTGTTCCTTG ACGATGATGT GGTTCCGGCG 
CCTAATCTGA TTGCTGAACA CATGCGGCTG CACAGTGAAT GTGAACGGCG GATAGTGCTC 
GGTCCGATGC TGACTCCGCC TGATGCCCGC TTGTCACCGT GGGTGGCGTG GGAGCAGGCG 
ATGCTGGAAA AGCAGTATCG CGCCATGACG AGCGGAATCT GGCCGGCAAC GGCCCGGCAA 
TTCTACACCG GGAACACCTC GTTGGCCCGG CAGTTGGTAT TGGCAGCGGG TGGCTTTGAT 
GAACGGTTTC GGCGTGCCGA AGATATTGAG TTGGCATATC GGCTCAATAA ACTTGGGGTT 
GAGTTTGTCT TTGCACCGCA GGCCATCGGT TATCACTATG CCGATCGGAG CTTTACGTCG 
TGGTTGGCAA CACCCTACGC ATACGGACGA AATGACATCA TCTTTGGCCG TGAACAGCAG 
GTTGATCTGC TCGGTTTTGT GCGTCGAGAA TTTGCGCAAC GTAATCAACT AACCCGTTGG 
TTAGTGTGGG TATTGCTCGA CCGTCCACGG GCGAGTGCTC TCGTACTGAG CATCTTACCC 
CGGCTGGCGC TACTAGCGCA TCGGCTATTC GGTGAGCGCG GGAGCCGTCC CATCTACAGC 
GCGATCTTTA ATTTGCGTTA CTACCAAGGA GTGGCCGACG AATTGGGCGG ACGCGACCGT 
TTCTTTGCAA TGCCGACTAT CGTTGAGGCA ACGCAACCCT GA

Protein sequence

MNDLSPTVSI VIPTYNRCDR LQRVLAALAK QTYPHTSFEV VIVSDGSTDG TAAFCQYAQT 
PFHLQFIQQA NAGPAAARNR GVAAARGTII LFLDDDVVPA PNLIAEHMRL HSECERRIVL 
GPMLTPPDAR LSPWVAWEQA MLEKQYRAMT SGIWPATARQ FYTGNTSLAR QLVLAAGGFD 
ERFRRAEDIE LAYRLNKLGV EFVFAPQAIG YHYADRSFTS WLATPYAYGR NDIIFGREQQ 
VDLLGFVRRE FAQRNQLTRW LVWVLLDRPR ASALVLSILP RLALLAHRLF GERGSRPIYS 
AIFNLRYYQG VADELGGRDR FFAMPTIVEA TQP