Gene Cagg_1781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1781
Symbol
ID	7267693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2187529
End bp	2188509
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	61%
IMG OID	643566622
Product	glycosyl transferase family 2
Protein accession	YP_002463117
Protein GI	219848684
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.456914
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.601286
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAAC ACACCGTTTC GATTATCTGC ACCGTGCGTG ACGAAGCCGA TAACATTGCC 
GCGCTGCTTG ATTCAATGTT AATGCAGACC CGCACCGCCG ACGAGATCGT GATTAACGAT 
TGCCAGAGTG TTGATGAGAC ACCGGCCATC GTTGCCGCCT ACGCCGCGCG CTACCCGCAG 
ATCAAGCTGG TGCGCGGCGG GCACAATATT TCGTCGGGCC GCAATAATGC CATTCGCCAC 
GCGCGCGGCC CGCTCATCGC CAGTACCGAT GCCGGTCTGA TCCTCGATCC GCACTGGCTC 
GCCCGCATTA TCGCCCCGCT CGAAACCGGC GATGCCGATC TGGTTGGCGG CTTCTTCCAT 
CCCACACCGC GCTCACTGTT TGCGCTGGCG CTGGGCGAAA CCAACTATCG TCGCAGCAGC 
GAGATCGATC CGCTCGCATT CTTACCCTTC GGTAAATCAA TGGCCTTTCG CAAAGAGGTG 
TGGGAAGCAG TAGGCGGCTT CCCGGAATGG GCCAGCCACT GCGAAGACTT GCTCTTCGAT 
CTGGCCGTTG AGCGAGCCGG CTTTCGCCGC GTTTTTGTCC CAGAAGCGGT GGTACACTTT 
GCACCGCGTT CCACCCTCCG AGCCTTTATT CGCCAGTATT ACCTCTACGC TCGCGGAGAT 
GGTCGGGCCG GGTTGTGGTC ACAACGTCAC GCGCTGCGGT ACGCCGTCTA TCTGACGCTC 
AGTGGGCTAA TGGGGATTGC CCTCAACCAA CCGCGCCTAC GAGCACCGAT TGGAGCGTTG 
ATCGGGCTAG GGGTCGCTGC GTATACCCGT GGTCCTTATC GCCGACTTTG GCCGAAACTC 
CGCGGCCGAC CACTCGGTGA ACGGCTCTTC GCGCTGGCAT TGGTCCCCCT GATCCGGCTG 
GTCGGCGACG TGGCCAAGAT GGTTGGCTAT CCGGTTGGTT TGTGGCGACG GCTTCAGCAT 
AACGGGAGGG CCGCAGGATA A

Protein sequence

MQQHTVSIIC TVRDEADNIA ALLDSMLMQT RTADEIVIND CQSVDETPAI VAAYAARYPQ 
IKLVRGGHNI SSGRNNAIRH ARGPLIASTD AGLILDPHWL ARIIAPLETG DADLVGGFFH 
PTPRSLFALA LGETNYRRSS EIDPLAFLPF GKSMAFRKEV WEAVGGFPEW ASHCEDLLFD 
LAVERAGFRR VFVPEAVVHF APRSTLRAFI RQYYLYARGD GRAGLWSQRH ALRYAVYLTL 
SGLMGIALNQ PRLRAPIGAL IGLGVAAYTR GPYRRLWPKL RGRPLGERLF ALALVPLIRL 
VGDVAKMVGY PVGLWRRLQH NGRAAG