Gene Cagg_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0139
Symbol
ID	7266878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	186235
End bp	187389
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	58%
IMG OID	643565011
Product	glycosyl transferase group 1
Protein accession	YP_002461526
Protein GI	219847093
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00161479
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTATCG GTGTCGACTT TACAGCAGGT ATTTGGCAAG GAGCAGGGAT TGGTCGCTAC 
ACGCGAGAAC TGGTGCGTGC TGCTGCCCAA GCCGGGCCTG ATCTGACGTT TCACCTCTTC 
TACGCGGCCG GTGGGATCAG GCCAAATAAT CCCTTTGCCC ATTATGCACA GGAACTGGCG 
GCTACCTATC CAAATGTCAC GTTACGGCCG CTACCGATCA GTCCGCGCCT GCTCACGATC 
ATCTGGCAAC GGCTACGATT GCCACTGCGG ATCGAGTGGT TTATCGGACC GATGGATGTG 
GTGCATGCAC CGGATTTTGT CTTACCGCCG ACACAGTCGC GCACCCTGCT GACTATTCAC 
GACCTCACGT TTCTGGTCGA ACCGGGTTGT GCCGAACCCG GCTTGCGACG CTATTTGAGT 
GAGGCAGTAC CCCGTTCACT CCGACGGGCC GATCTCATTG TTGTCGACTC ACAGTCTACG 
GCGAACGATT TGGGGCGGCT CTATGGGATA CCGAGTCGGC GTGTACGTCT GCTCTATCCG 
GCCGTGGATG CACGTTTTCG ACCATTACCG CCGGACGAAC TCGCCACGGT GCGCACAAGG 
CTAGCGCTAC CGGATCGATT CCTGCTCTTT GTCGGAACGC TTGAACCGCG TAAAAACCTT 
GTCCGCCTGT TACATGCCTT TTCCCTGGTA CAATCTGACT ATCCCGACTT GCAGCTCGTT 
ATTGCCGGGC GACGTGGTTG GTTGTACGAC GAGATTTTTG CTGCGGTAAC GCAGTATCAG 
GTGGCCGACC GAGTACGTTT CCTCGATTTT GTTGCCGACG ACGATCTACC GGCATTGTAT 
AATTTAGCCG AAGCCTTCGT TTACCCATCG TTGTACGAAG GGTTTGGCTT TCCGGTACTC 
GAGGCGCTCG CCTGCGGAAC GCCGGTTGTC ACGACTAAAG TGGCGAGCTT ACCAGAAGTG 
GCCGGATCGG CCGCCATTAT GGTCGATCCG CTAGAGGTCG AAGATATTGC TGCTGGTATC 
CACGCTGCGC TCGCCGATCC GGCGCCGCTC CGCGCTGCCG GGCCACCGCA GGCTGCGACC 
TTTCGCTGGG AACAGACCGG ACAGGCGCTG GTGGCAATCT ACCGTGAGCT CGCGGCAAAA 
GCCGCTGCCA CTTGA

Protein sequence

MRIGVDFTAG IWQGAGIGRY TRELVRAAAQ AGPDLTFHLF YAAGGIRPNN PFAHYAQELA 
ATYPNVTLRP LPISPRLLTI IWQRLRLPLR IEWFIGPMDV VHAPDFVLPP TQSRTLLTIH 
DLTFLVEPGC AEPGLRRYLS EAVPRSLRRA DLIVVDSQST ANDLGRLYGI PSRRVRLLYP 
AVDARFRPLP PDELATVRTR LALPDRFLLF VGTLEPRKNL VRLLHAFSLV QSDYPDLQLV 
IAGRRGWLYD EIFAAVTQYQ VADRVRFLDF VADDDLPALY NLAEAFVYPS LYEGFGFPVL 
EALACGTPVV TTKVASLPEV AGSAAIMVDP LEVEDIAAGI HAALADPAPL RAAGPPQAAT 
FRWEQTGQAL VAIYRELAAK AAAT