Gene Cagg_1696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1696
Symbol
ID	7267341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2069335
End bp	2070435
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	59%
IMG OID	643566538
Product	glycosyl transferase group 1
Protein accession	YP_002463033
Protein GI	219848600
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACATCT GGTGGATCGA TCCGTTTCAT GGTGGATCAC ACGCGGCAGT AACAACCGGT 
TATGCCGCGC ACAGCCAACA TCGTCTTACC CTCATTACGT TGAGTCAAGC CGGGGGGTGG 
CGGTGGCGTA TGCGCGGTGC TGCGTTGACC TTGGCGAGGA TGGTGAGCGA ACGGCACGAT 
GTGCCCGACC TGATCGTCAC GACCGATATG CTCGATCTGG CGACGTTTCG GGCCTTGACC 
CGGCACCGGT TGGGGCACGT GCCGATGGTG ATCTATTTTC ACGAAAACCA ACTGACCTAC 
CCATTACCGC CGGGCCGTAA GCGTGATGAT GCGTTTGCAT GGATCAATCT GACCGGTGCG 
TTGGTCGCCG ATGCGGTGAT CTTCAATTCA GAGTTTCATC GGCGTGATTT TTTGACGGCG 
CTGCCGAGCC TGTTACGGCG CTATCACGAT TATCATGAAC TCCAGGCGGT TGGTCAGATT 
GCAGCAAAAG CGCTGGTCTT ACCGCCAGGC CTCGATCTGC CGCCGTTACC ACCACGGCCG 
CCACGTGATC CGACGGCTCC GCCGGTCATT GTTTGGAATG CCCGTTGGGA ATATGACAAA 
CAACCGCAGG TTGTGATGGC AGCGCTGGAG TATCTGGCAG CGCAGGGGAT CGACTTTCGC 
CTCATCGTCA CCGGTGAGCA TATCGATCCC GTAGCCGATG ATTTGGTGGC GGCGCGGCAA 
CGGTGGGCGG CACAGACGAT CCATTGGGGG TTCGCTGCAA ATCGTGCGGC GTATCTCCAT 
TTATTGCAGC AAGCCGATAT TGTGGTTTCG GCGGCTATCC AAGAGTTTTT TGGGCTGGCC 
ATTCTCGAGG CGCTGGCGTG TGGGTGTGTG CCGGTATTGC CGGCGCGGCT CAACTATCCT 
GATCTGATTC CACCGGAATG GTACGCCGAC TGTCTGTATG CCGACGATGC CGATCTACCG 
ACGACATTGG CGCGCACGGT GGCACGTTTG CCGGAGTTGG CCCAACGTGA TTGGGCCGCG 
CTGGCCGAAC CGTACCGCTG GCACAACCTT GCCCCGCGTT ACGATGCGGT ACTGGCCGAT 
CTTGCCGCTC CTGTGTCTTA A

Protein sequence

MHIWWIDPFH GGSHAAVTTG YAAHSQHRLT LITLSQAGGW RWRMRGAALT LARMVSERHD 
VPDLIVTTDM LDLATFRALT RHRLGHVPMV IYFHENQLTY PLPPGRKRDD AFAWINLTGA 
LVADAVIFNS EFHRRDFLTA LPSLLRRYHD YHELQAVGQI AAKALVLPPG LDLPPLPPRP 
PRDPTAPPVI VWNARWEYDK QPQVVMAALE YLAAQGIDFR LIVTGEHIDP VADDLVAARQ 
RWAAQTIHWG FAANRAAYLH LLQQADIVVS AAIQEFFGLA ILEALACGCV PVLPARLNYP 
DLIPPEWYAD CLYADDADLP TTLARTVARL PELAQRDWAA LAEPYRWHNL APRYDAVLAD 
LAAPVS