Gene Cagg_0800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0800
Symbol
ID	7268119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	994459
End bp	995676
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	60%
IMG OID	643565651
Product	glycosyl transferase group 1
Protein accession	YP_002462160
Protein GI	219847727
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCC TCATCCTCTC AACGTGGTGG CCTGAACCCG ACGACAACGG CTCGCGTTTG 
CGAGCAATGG CGATTCTGCG CGGCTTAGCG GCCCGGCACG AACTACACCT GCTGGCCTTC 
AGTCAAGGGC CGGCCACTGA GGTACAAGCT AACGAAATCG GACGGTTGTG CCGCTCGTGG 
CAAGCATTCA CACGACCTGA CCGATTGCTG ACGGTGCGAG ATCGGCTGGG GAGTTTGATC 
AGTCCACGAC CGGCTGCAGT ACGGGTACGG TGGAGCAAGC CTCTCGCACA GGCAGTGCAA 
GAGGCGGTGG TACGATGGCA ACCGGATGTC GTATTGGCGT TACAAATCGA CATGGCACCA 
TACGCCTTGC TCGCCCGCAA TCTCCCACTC GTCCTTGAAG AACTAGAACT GGCGCTCATC 
TTGGAAGACT ACCAACGCTG GCGAGGACTG CGTCGGTTAC GGAGCCTCCT GACGGCACTG 
CAACATCGCC GCTACGTATC AACAATCTTG CCGGCGTTTG CGGCTGTCAC CACTGTTTCC 
GAACGGGAAG CGGAACTTGC CCGCCAGATT GTCGGAACAC AACATCCGAT CATCACGGTC 
ATTCCCAACG GGGTTGATAG CGCCGCTTGC GCCGCTTACG GCTACCGGCC CGAACCTGAC 
ACGCTGATCT ACCCCGGTGC GCTCTCGTAC AGTGCTAACT TTGATGCGGT CAATTACTTC 
CTCGGCCAAA TCTGGCCACT AATCCGCGCC CGCCACCCAC AAGCGCGCTT CCGTATTACC 
GGACGAGTCA CCGCTGAGCA GCGTGCGGCG TTGCCGAACG GGCCAGGGAT TGAATTTACC 
GGCTATGTAG ACGACATCCG TGACGTGATT TCACACCATG CGGTTGAAGT AGTGCCCATC 
CGCGAGGGGG GTGGTACGCG GCTAAAGATT CTCGAAGCGC TGGCGTTAGG GGTGCCCGTG 
ATCAGCACGA GCAAAGGAGC GGAAGGGCTA GCGCTGATTG ACGGCAAACA CCTGCTATTG 
GCCGATACGC CAATGGATTT CGCCCGTGCC ACGAGCCGCC TGCTCAACGA CCCACCGCTC 
GCCCACCAGC TTGGCGCAGC CGGCCAGCAC GCGGTGGCCG CGCGTTACGA TTGGCAAGTG 
ATTGTGCCAC GCTTAAACGA CGTACTGGAA GAAGTTGCAC AACCAAGGAA GCACCGCTAT 
GACCTGGTCC GTGCCTGA

Protein sequence

MRILILSTWW PEPDDNGSRL RAMAILRGLA ARHELHLLAF SQGPATEVQA NEIGRLCRSW 
QAFTRPDRLL TVRDRLGSLI SPRPAAVRVR WSKPLAQAVQ EAVVRWQPDV VLALQIDMAP 
YALLARNLPL VLEELELALI LEDYQRWRGL RRLRSLLTAL QHRRYVSTIL PAFAAVTTVS 
EREAELARQI VGTQHPIITV IPNGVDSAAC AAYGYRPEPD TLIYPGALSY SANFDAVNYF 
LGQIWPLIRA RHPQARFRIT GRVTAEQRAA LPNGPGIEFT GYVDDIRDVI SHHAVEVVPI 
REGGGTRLKI LEALALGVPV ISTSKGAEGL ALIDGKHLLL ADTPMDFARA TSRLLNDPPL 
AHQLGAAGQH AVAARYDWQV IVPRLNDVLE EVAQPRKHRY DLVRA