Gene Cagg_2959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2959
Symbol
ID	7268832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3628477
End bp	3629673
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	59%
IMG OID	643567781
Product	glycosyl transferase group 1
Protein accession	YP_002464255
Protein GI	219849822
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000811696
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCGCATTC TCTATTTAGC CTCTGGCATT CCGGTACCGG GGACATTGGG CGGCAGCATC 
CACACCTTGG AAGTTGCGCG TGGGCTGGCT CAACGCGGTC ATGACGTTCA CGTGGTCGCA 
GCGAGCCGTG AGCTGCCGCT CAGTTATGTT CGGCTCCGGC CAATGCGTCA ACTCACCGCG 
CAGTCGTGGA ACGGTTTTAC CCTCTACCAC CAAGACATTC CCAAAGCCCT TAGCCTACTG 
GGAACGGCTG CAATTATCAA GCTCACCCGG CAACTCCGGC CCGATCTGAT AATGGAGCGC 
TACTACAACT TTGCCGGCGC CGGCCTCATC GCCGCCCGTC GACTCGGCAT CCCGACCCTG 
TTGGAAGTAA ACGCCTTGAT CGTTGATCCA CCGGAGATTC TCAAACGACG GATCGATGAC 
GCGCTCGGTG GGCCATTTCG ACGCTGGGCA GAACAACAGT GTCGTTGGGC GAGTCGAATT 
GTGACGCCGC TGCATACGAC GGTTCCGGCA GGCATTCCGC GCGACAAGAT CATCGAGCTA 
CCTTGGGGAG CGAATGTAGA GACCTTCACC CCACCACCTA CCCCACCGCC CGGACCGCCC 
AAGGTGATCT TTATGGGTTC CTTCCGCGCA TGGCATGGAG TGAGCGATTT TGTCTACGCG 
GCCCGCTTAC TTATCGAGCG GGGGCACCCC GCTCACTTCG TGCTCATCGG TGATGGACCT 
GAACGGGCCG CTGCCGAATC CTTAGCTGCA CCCTACCGGG ATCGGTTCAC TTTTACCGGC 
GCAGTACCAC ACCAACAGAT TCCTACCTTG CTCGGCCAAG GCCATCTGGG TGTGGCACCC 
TTCAACACCG CGCCCCATCC GGCCCTACGC GCCGCCGGCT TTTTCTGGTC ACCCCTCAAA 
ATCTACGAAT ACATGGCCGC CGGTCTGCCG GTCGTTACTG CCGCGATCCC TCCGCTCACC 
ACGATTATTC GTGAGGGAAT TGAAGGGGCA CTCTTTCGCG AAGGTGATGT ACATGACCTG 
GCAGCGGCGA TTGAACGGGT CTTAGTCAAC CCTGCGGCTG CCTTTGCAAT GGGGCAACGT 
GCCCGCGCGC GCGTCGTCGC CGAGTTTTCG TGGCAACGAC ATTGTGCCGA GCTAGAGCAC 
ATTGGAGAAT CTTTGATCAA AACAAACTCT CACCACATTT TAAGAAAAAT CCAATAA

Protein sequence

MRILYLASGI PVPGTLGGSI HTLEVARGLA QRGHDVHVVA ASRELPLSYV RLRPMRQLTA 
QSWNGFTLYH QDIPKALSLL GTAAIIKLTR QLRPDLIMER YYNFAGAGLI AARRLGIPTL 
LEVNALIVDP PEILKRRIDD ALGGPFRRWA EQQCRWASRI VTPLHTTVPA GIPRDKIIEL 
PWGANVETFT PPPTPPPGPP KVIFMGSFRA WHGVSDFVYA ARLLIERGHP AHFVLIGDGP 
ERAAAESLAA PYRDRFTFTG AVPHQQIPTL LGQGHLGVAP FNTAPHPALR AAGFFWSPLK 
IYEYMAAGLP VVTAAIPPLT TIIREGIEGA LFREGDVHDL AAAIERVLVN PAAAFAMGQR 
ARARVVAEFS WQRHCAELEH IGESLIKTNS HHILRKIQ