Gene Cagg_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2079
Symbol
ID	7266980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2542866
End bp	2544071
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	58%
IMG OID	643566914
Product	glycosyl transferase family 2
Protein accession	YP_002463403
Protein GI	219848970
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.959735
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGCGC TCGTCTGGTT GGTGCTGACG GTCGTGTACT GGGTTGCCGG CATTGTGCTG 
GCGTTGATCG TGGGCTATCT GCTGTTACTG ACGGGAGCTG CGTTGTTTGC CCGCCGCACA 
ACACCGCTGC GCGCGCAACC GACTACGCGC TTCGTGATTA TGATTCCGGC GCATAATGAA 
GAGCGCCTGT TGCCCGATCT GCTAACCAAT CTCAACCAAC TCGATTATCC ACGTGACCTG 
TACAGCATTC ACGTTGTTGC CGACAACTGC ACCGACCGCA CGGCTGCTGT GGCGATGGCC 
CATGGTGCGA TTGCCTATGA GCGATTTGAC CAGACGCTGC GTGGGAAGGG ATACGCGCTC 
GAATGGCTGT TACAGCAGAT TTGGGCACGC AACGAACCGC ACGACGCCGT TGTTATTCTT 
GATGCCGACT CGGTTGTCTC ACCGACCTTT CTGCGCGTGA TGGATGCTCG CCTTGCGCGG 
GGCGAGCGGG TGATACAGGC CTATTACGCG GTACGTCAGC CGGAAGGGGC GTGGAGTGCG 
GGGATACGGG CGGTGGCGTT GATCGTCCTT CACTACCTGC GTCCGCTAGG GCGCATGGTT 
TTGGGTGGTT CGACCGGTTT GAAGGGCAAT GGCATGGTCT TTGCCGCCGA TATTTTGCGG 
CGCTACCGCT GGACGGCATC ACTCACCGAG GACATTGAAT ATCACATGAC CCTGATTCTT 
GCCGGTGAGC GCGCAATGTT TGCACCTGAT GCAGTGGTAT GGGCCGAGAT GCCCGATAGT 
CTCCGGGCGG CCCAGAGCCA AAATGAGCGA TGGGAAAGGG GCCGGCTGGA GATGGTGCGT 
CGGTATGTAC CGCAATTGCT GCGCGAGGGA TTGCGCCGAC GCAGCTTTTT GCTGATCGAT 
GCAGCGATTG AGCAACTGAT CCCGCCATTT TCGGTGGTCA CCGGTATGAG TATTCTGGTG 
GCGTTGGTAG CGATCGTACT ACGCGAACCG GCAGCACTGG CACTGGCCGG TTTCATCATT 
GGTGGGCAAG TAGTATATGT CCTCAGTGGG TTGCTGCTAG TACGTGCGCC GTGGTCGATC 
TACCGGTCGT TGTTGTTTAC CCCCTTCTTT TTAGGGTGGA AGCTCTGGCT CTACATTCGC 
TTGTTACTCG GCGTTAAACC GCGCGATTGG ATTCGCACGG CTCGTAATCG GGCGCAACGT 
CCATAG

Protein sequence

MIALVWLVLT VVYWVAGIVL ALIVGYLLLL TGAALFARRT TPLRAQPTTR FVIMIPAHNE 
ERLLPDLLTN LNQLDYPRDL YSIHVVADNC TDRTAAVAMA HGAIAYERFD QTLRGKGYAL 
EWLLQQIWAR NEPHDAVVIL DADSVVSPTF LRVMDARLAR GERVIQAYYA VRQPEGAWSA 
GIRAVALIVL HYLRPLGRMV LGGSTGLKGN GMVFAADILR RYRWTASLTE DIEYHMTLIL 
AGERAMFAPD AVVWAEMPDS LRAAQSQNER WERGRLEMVR RYVPQLLREG LRRRSFLLID 
AAIEQLIPPF SVVTGMSILV ALVAIVLREP AALALAGFII GGQVVYVLSG LLLVRAPWSI 
YRSLLFTPFF LGWKLWLYIR LLLGVKPRDW IRTARNRAQR P