Gene Cagg_0106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0106
Symbol
ID	7266844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	149233
End bp	150642
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	57%
IMG OID	643564978
Product	glycosyl transferase group 1
Protein accession	YP_002461494
Protein GI	219847061
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.341014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.913948
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCGC GGATCGCGTA TTGCTCGCCT GTTAACCCGG CTGCGTCGGG TATTTCCGAC 
TATAGCGAGG AGCTGTTACC TTATCTTGCC CAATACGCCG ACATCACTCT GCTTGTCGAC 
GATGGGCTGC ATCCGACGAA TCCGTTCCTT CGTCAGTACT TAACCATTCA ACCCCTGCGC 
AAACTCGAAC ATTTTGTTCG GCGCGGGGCA TTCGATGCAA TTGTCTACCA CATGGGCAAT 
AGCCCGGTTC ACGCCAGAAT ATGGCAGTCA GCCCAACGTA TTCCCGGGGT GGTGGTGTTG 
CACGACTTTG TGTTACACCA CTTTATGCTC TGGTATGCCG CGAACGTTCA GCGTGATGTG 
CAGCGTTATG TGACGATGAT GCGCACACGC TACGGAGATG AGGGGTGGCA TGTTGCTCAG 
CTCATGATCC GCTCACGTTT TAGTGCGGCT GCTTTTAACT TTCCGTGCAA CGAAGATGTG 
CTCGCTGCTG CCCAAGCCGT GATCGGTCAC AGTCGGCATA TCCTCGATCG CGTGGCCGCG 
ATCCGTCCCG ATCTGCCCCG TGGTCTCGTG CCGATGGGTA TTCCCTTACC ACCACTGATT 
GACCGCAACG AGGCCCGTCA ACGGCTTGGT ATCCCGCTCG ACCGTCCACT ATTGGCGAGT 
TTTGGTCATA TCAATGCGTG GAAGCGGATC GAGCCAATGC TGCGTGCGCT TGCTCTCCTG 
CGTCGCGAAG GTATTGACGC CCATTGTGTG CTCGTAGGTT CGGTGTCACC AAACTATGAC 
CTCGATAGCC TAATCTGGCG TCTTGGCCTG CAAACGGCGG TAACGGTGAC CGGGTATGTT 
CCAAGAACGC AATTTGAGTA CTACGTGGCG GCAGCCGACA TTTGTTTCAA TTTGCGCTAC 
CCAACTGCCG GTGAAACGAG TGCCAGTCTA TTGCGACTGC TAGGTGCCGG CAAACCAACG 
CTGGTCAGCG CGGTCGATGC GTTTTGCGAA TTACCTCCTG ATGTTGCCGC GCAGGTTGAT 
GTGGACGGGA GTGAGATCGA CTTAATCGTC GCCTATTGCC GACGGTTATT GTCCGATCGC 
TCCTTGGCTG CGGCGTTGGG GGCACGGGCG CGGGAATATG TTGCCACCGA ACATACCCTC 
CCCGGTGCCG CACAGGCGAT GATCCGCTTT TTGGCCGACG TATACGGTTG GCCGCCACCT 
CGCTTGATCC ACCCCCAACC CCTCTGGGAT CCAACACCGG TCTGTGAACC GGAACCGGTA 
GAAACGTCGG CGCCAACGAT AACTGCACCT GCCCAGCCAT CGCTTCTGAT ACAATCGGCA 
GCCCGCGCTG CTGCAGAGAT CGGTCTGACC GAAGACGATA CAGATGCGCT GCGTTCGGTA 
GCGGTGCGGA TTAACGAATT AACCGCATGA

Protein sequence

MMPRIAYCSP VNPAASGISD YSEELLPYLA QYADITLLVD DGLHPTNPFL RQYLTIQPLR 
KLEHFVRRGA FDAIVYHMGN SPVHARIWQS AQRIPGVVVL HDFVLHHFML WYAANVQRDV 
QRYVTMMRTR YGDEGWHVAQ LMIRSRFSAA AFNFPCNEDV LAAAQAVIGH SRHILDRVAA 
IRPDLPRGLV PMGIPLPPLI DRNEARQRLG IPLDRPLLAS FGHINAWKRI EPMLRALALL 
RREGIDAHCV LVGSVSPNYD LDSLIWRLGL QTAVTVTGYV PRTQFEYYVA AADICFNLRY 
PTAGETSASL LRLLGAGKPT LVSAVDAFCE LPPDVAAQVD VDGSEIDLIV AYCRRLLSDR 
SLAAALGARA REYVATEHTL PGAAQAMIRF LADVYGWPPP RLIHPQPLWD PTPVCEPEPV 
ETSAPTITAP AQPSLLIQSA ARAAAEIGLT EDDTDALRSV AVRINELTA