Gene Cagg_1652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1652
Symbol
ID	7268954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2015276
End bp	2016424
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	55%
IMG OID	643566494
Product	glycosyl transferase group 1
Protein accession	YP_002462989
Protein GI	219848556
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATGTTG CAATTAATGC TCATCTCTTG GCTCATACTA CCTCGTTTCG TCGTGCTGGT 
GTCTCGCATT ATATCGAGCA AGTTCTGCTC CATCTTGCCC AGATCGACCA CGAGAATCGG 
TATACGATCT ACACGACGCG CGGTCTCGAT CAAGCGGCAT TGGGCTTGCC ACCCAACTTT 
GTTGTCAAAC CATCACGGTT GCCGACGATC AACCCGCGGA TCCGTATTCC ATGGGAACAG 
GGTATCGCGC CGTTCCTCTT GCGCGGCAAA GTCGATCTCT ATCACGGGTG TCTTAACGTA 
GCTCCGTTGC TGAGTCCGGT ACCTACCGTT ATCACGATTC ACGACCTGGC CTTTATTCGC 
TTTCCCCAAA CCTTTCGTGC CTACAACCGG ATCTATCTTG ATCTGGCGAC CCGGCTGAGC 
GCACGACGGG CCAGTCGGAT TTTAGCCGTG TCTGAACATA CCAAACGCGA AGTAGCCGGC 
TTGTTCGGTA TCCCACCAGA ACGTATTGTC GTGACACCAA ATGCGACGCG CAGCCATTTT 
CGTCCATTCG CAGCGGACAT CATCGACCAA TTTCGTGCTC GTAAGGGGTT ACCCGCTCGC 
TTTATCTTGT ACGTCGGTAC CCTTGAACCA CGCAAAAATT TGACGACGCT GCTCGAAGCG 
TTTGCCCTGG TCAGCCGTCG TGTTCCCTCA GTCCCGTTGC TGATCGGTGG CGGGAAGGGG 
TGGATGTATC AACCGATCTT TGCCCGTCTC GAGCAATTGA ACCTGCAAGA CCGAGTGAAG 
TTTGTTGGCT ATATTCCCGA AGAGGAATTG CCGCTGTGGT ATGCCGCTGC TACTATCTTC 
GTTTTTCCGT CGATTTACGA AGGCTTTGGT ATGCCACCAC TTGAGGCAAT GGCATGTGGA 
ACGCCGGTGA TTACCTCCAA TACGTCAAGC CTGCCGGAAG TGGTCGGCGA TGCCGGTTTG 
ATGGTAGATC CCGCCGCTCC TACCGCGCTC GCCGATGCGA TGATGCAGTT GCTTACCGAT 
GCCGATCTGC ATGCCGCATT ACGCCAACGT GGCTTGGAAC GTGCTCGTCG CTTCTCGTGG 
ACCGAAACTG CTGCCAAGAC GTTGGCGGTG TATCGGGAAG TGAGTGCCGA AATGGCGTAT 
CCACGCTGA

Protein sequence

MHVAINAHLL AHTTSFRRAG VSHYIEQVLL HLAQIDHENR YTIYTTRGLD QAALGLPPNF 
VVKPSRLPTI NPRIRIPWEQ GIAPFLLRGK VDLYHGCLNV APLLSPVPTV ITIHDLAFIR 
FPQTFRAYNR IYLDLATRLS ARRASRILAV SEHTKREVAG LFGIPPERIV VTPNATRSHF 
RPFAADIIDQ FRARKGLPAR FILYVGTLEP RKNLTTLLEA FALVSRRVPS VPLLIGGGKG 
WMYQPIFARL EQLNLQDRVK FVGYIPEEEL PLWYAAATIF VFPSIYEGFG MPPLEAMACG 
TPVITSNTSS LPEVVGDAGL MVDPAAPTAL ADAMMQLLTD ADLHAALRQR GLERARRFSW 
TETAAKTLAV YREVSAEMAY PR