Gene Cagg_0674 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0674
Symbol
ID	7266925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	834249
End bp	835397
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	56%
IMG OID	643565535
Product	glycosyl transferase family 2
Protein accession	YP_002462045
Protein GI	219847612
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00780318
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGGTTTG CTCTTCTATG GGTGCTGAGC GGCTTGGCCC TGATCGCTAG TTTTGGTATG 
AATTGGCGGC GTATGCGTCG TATTCCACGT CTATCGCCGC CTTGCTTGCC ACCTGATCCG 
CCGTTGATCT CGATTCTGAT CCCGGCACGA AATGAAGAAC GGGTGATTGG TCGTTGTGTG 
AGGGGTGTCC TTGCGCAGCG CTATCCAAAT TTCGAGGTGA TCGTCGTTGA TGACGGGTCT 
ACCGACCGTA CCCCGGCAAT TCTCGCCGAT CTAGCCGCTA ACGATCCGCG GTTGCGCGTG 
ATACCGGGGC GCACGTTGCC GCCGGGTTGG GTGGGTAAGT GTCATGCATG TCAGCAGGCC 
AGTGATGTGG CCAAAGGGAC TTGGTTACTG TTTCTCGATG CTGATACCGT CCCAGAGCCG 
GATTTGACGG CAGCGTTGCT TTGTCACGCA TTGGCAACAA ATGCCGATCT GGTAACAATT 
TTCCCGTTTC TTGCGTTGGG AACGTGGGCT GAACGCCTGG TCTTACCATC GTTCGTGGCC 
TTAATTGTCT CGATCTTTCC TTTCGAGCGC CTCTCTCAAC CTGATGTTCG TCCCACCGAG 
GTGCTGGCGA ACGGTCAATG TCTGTTTGTG CGACGTTCAG CTTACGACGC AGTTGGTGGT 
CATTATGCGG TACGTGGTGA AGTTCTTGAA GATGTTCGAC TAGGTCAGAC GTTGCGTGCC 
GCCGGTTTTA CCGTCCGTGG TGCGATCGGG ATGGAATATC TCTCGGTACG GATGTATACG 
AATGCCCGTG AGGTCGTCGA AGGCTTGATG AAGAATGCGT CGGCCGGTTC GCGCAGTGGT 
GGCTGGCGCT CACTGGCCGG GATGGGATTA CTATTAGGAC AGGCGTATGG GCCGTTGATC 
CTTATGGTAG GTGGGTTGCT TGGTGGTGGT GTGGCCGGTC AGGCGGCATT GGTCGCCGGC 
TTGGTGGCAT GGCTGGCCGG TTTACTTTTT TGGGGAATGT TGTATCGTGG TTTTTATCGT 
CTGAGCCCCT TCTATGCGCT CTTGTGGCCG ATTGGGTTGC TGATGTATCT AAGTATCGCC 
GGTTGGGGTA TTGTACAAGT CTGGTTAGGC CGGGGCGTGA TGTGGAAAGG CCGGCGCTAT 
GCGGGATGA

Protein sequence

MWFALLWVLS GLALIASFGM NWRRMRRIPR LSPPCLPPDP PLISILIPAR NEERVIGRCV 
RGVLAQRYPN FEVIVVDDGS TDRTPAILAD LAANDPRLRV IPGRTLPPGW VGKCHACQQA 
SDVAKGTWLL FLDADTVPEP DLTAALLCHA LATNADLVTI FPFLALGTWA ERLVLPSFVA 
LIVSIFPFER LSQPDVRPTE VLANGQCLFV RRSAYDAVGG HYAVRGEVLE DVRLGQTLRA 
AGFTVRGAIG MEYLSVRMYT NAREVVEGLM KNASAGSRSG GWRSLAGMGL LLGQAYGPLI 
LMVGGLLGGG VAGQAALVAG LVAWLAGLLF WGMLYRGFYR LSPFYALLWP IGLLMYLSIA 
GWGIVQVWLG RGVMWKGRRY AG