Gene Cagg_3435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3435
Symbol
ID	7269660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4172539
End bp	4174923
Gene Length	2385 bp
Protein Length	794 aa
Translation table	11
GC content	54%
IMG OID	643568245
Product	glycoside hydrolase family 9
Protein accession	YP_002464713
Protein GI	219850280
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.019722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0493729
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTCCA CCATTCTCTT CTTCGCAGCC GTTATCTGGA CACTTAGGTT GATTCCGTCC 
CCGCTAATAG TGCTTCCCAC CACGCAGTTT AATTACGGCG AAGCTCTGCA AAAGTCGATC 
TTTTTCTACG AAATCCAACG TTCCGGCCGT CTACCGCCCG ATAATCGGGT TCGGTGGCGT 
GGTGATTCGG GTCTGAACGA TGGCGCCGAT GTTGGTATTG ACCTAACCGG TGGCTGGTAT 
GATGCAGGTG ATCATGTGAA GTTTGGGTTT CCGATGGCGG CCTCGGCTAC GCTACTGGCA 
TGGGGCGTAG TCGAATATCG GCAGGCCTAC GAACAAGCCG GCCTGCTCGA CGATATCTTA 
GCCAATTTGC GCTGGGCGAC TGACTATTTC ATCAAAGCTC ACACAGGGCC ATTTGAATTC 
TATGGCCAGG TGGGTGATGG TCACCTTGAT CATGCATGGT GGGGGCCGGC TGAAGTGATG 
CCGATGCCAC GACCGGCGTA CAAGATCACC GCCGACTGCC CCGGTTCTGA TCTCGCCGCC 
GAGACGGCAG CAGCTTTAGC TGCCGCATCC ATCGCTTTTC GCCCGACCGA TCCTGATTAT 
GCCGAACAGA TGCTTAATCA TGCGCGTCAG CTCTACACCT TTGCCGATAC GTATCGCGGG 
AAGTATAGCG ATTGTATTCA AAATGCAGCA GCATTTTACA ACTCGTGGAG CGGTTATCAG 
GACGAACTGG TCTGGGGTGC GGCGTGGTTG TATCGCGCGA CAGGGGAATC GACATACTTA 
AGCAAAGCGC AACAGTATGC AATGCAGCTC AGTGGTCAAT ATAAATGGAC GCACAATTGG 
GATGATAAAT CGTATGGTAG CTACATCCTG TTAGCTCAAC TGACCGGTCA ACCAACTTAC 
CGCGCCAATG TTGAGCGGTG GCTCAATTGG TGGACGGTTG GCGGTACTGA GCATGGCGCC 
GATGGTACGC GAATCACCTA TAGTCCGGGT GGGCAAGCGT GGCTAAGTCA ATGGGGATCG 
CTGCGGTACA CGGCGAACAC GGCATTTCTC GCGTTCATCT ATGCCGATTG GCTGGCCGCC 
AATCACGGCG ATGAGCAGAA GATCGTGCGC TATCGCGATT TTGCCGTCCG CCAGATCAAC 
TACATTCTTG GTGAGAATCC ACGTGGGTGT AGTTATATGG TTGGGTTCGG CAATTGTCCT 
CCCCAAAACC CGCATCATCG CACAGCACAT GGATCATGGC TCGACTCAAT TGATCAACCA 
CCGTATCAGC GTCACATCCT CTACGGCGCT CTCGTTGGTG GACCGGCTCA GCCCGACGAT 
CAGTATCATG ATGTCCGCAG CGACTATATC ATGAATGAAG TCGCTACCGA CTATAATGCC 
GGCTTGACCG GTGCATTGGC GCGTATGTAT GCGTTGTTCG GTGGCGAACC GCTTACCAAC 
TTTCCTCCTC CGGATCTTCC GCCCGATGAT GATGAAGTCT ACGTGCAAGC CACCGTCAAT 
GCGAGTGGCC CGAATTTCAC CGAGATCAAA GCTTTTATTA TTAATAAATC GGGTTGGCCG 
GCCCGCGTAA CCGACCGGTT AACGATGCGC TACTTCTTTA CTCTTGATGG TGATACCCGT 
CCGGAGGATA TTACCGTCAG TGTACCGCGT AATCAGTGTC GCAGTGTCTC ATCGCCGATC 
CAGTATACTG ATACGGTGTA TGCGGTTGTC ATCGATTGTG TTGGCGTTAG CATCTATCCC 
GGCGGCGCCG ATCATTATCG AAAAGAAGTC CAGTTTCGGC TGACAAGCAG CAAACAGTGG 
GATCCAAGTA ATGATTGGTC GTATCGCGAT TTGCGCGCAA CGACGTCGGG CAATCTGATC 
AAAGTGACGA CGATCAGTTT GTACGAGGAT GGGACGCGCA TTTGGGGAAC AGAACCAGGC 
GGTGCAATTC TACCGCCCCC CGTTACCGAA CGATACGTCT ATATCCCACT GATTGTTGGT 
AGTGGCGGGC AGAGCATATC GACGCCGACT CCAGCCCCAA CTATCCTACC GACTTCAACG 
CCACCTCCAG TCGATTCGGC AGGATGTCGG GTGAGGTATC ATGTGCAACA GGCGTGGAAC 
GATGGGGCAA CGATCACAGT CGTCATCACG AATACCGGAT TACTGGCGAT TGATGGGTGG 
ACACTGGCAT GGCAATTTCC CGATGGGCAA CAGATGGTAA CCGATTTCTG GAATGCGGTG 
ATTACGCAAG TCGGACGCGA TGTCAGTGCT GCGCACGTCG ATTGGAACCG CGCACTTGCT 
CCCGGTGCCC AGCAACAGTT TGGGTTTAAC CTCCAACATA GTGGCGCCAA TCCGCGACCG 
TCACAGTTTA CGCTAAACGG TATGATTTGC AATGTAGATA GTTAA

Protein sequence

MRSTILFFAA VIWTLRLIPS PLIVLPTTQF NYGEALQKSI FFYEIQRSGR LPPDNRVRWR 
GDSGLNDGAD VGIDLTGGWY DAGDHVKFGF PMAASATLLA WGVVEYRQAY EQAGLLDDIL 
ANLRWATDYF IKAHTGPFEF YGQVGDGHLD HAWWGPAEVM PMPRPAYKIT ADCPGSDLAA 
ETAAALAAAS IAFRPTDPDY AEQMLNHARQ LYTFADTYRG KYSDCIQNAA AFYNSWSGYQ 
DELVWGAAWL YRATGESTYL SKAQQYAMQL SGQYKWTHNW DDKSYGSYIL LAQLTGQPTY 
RANVERWLNW WTVGGTEHGA DGTRITYSPG GQAWLSQWGS LRYTANTAFL AFIYADWLAA 
NHGDEQKIVR YRDFAVRQIN YILGENPRGC SYMVGFGNCP PQNPHHRTAH GSWLDSIDQP 
PYQRHILYGA LVGGPAQPDD QYHDVRSDYI MNEVATDYNA GLTGALARMY ALFGGEPLTN 
FPPPDLPPDD DEVYVQATVN ASGPNFTEIK AFIINKSGWP ARVTDRLTMR YFFTLDGDTR 
PEDITVSVPR NQCRSVSSPI QYTDTVYAVV IDCVGVSIYP GGADHYRKEV QFRLTSSKQW 
DPSNDWSYRD LRATTSGNLI KVTTISLYED GTRIWGTEPG GAILPPPVTE RYVYIPLIVG 
SGGQSISTPT PAPTILPTST PPPVDSAGCR VRYHVQQAWN DGATITVVIT NTGLLAIDGW 
TLAWQFPDGQ QMVTDFWNAV ITQVGRDVSA AHVDWNRALA PGAQQQFGFN LQHSGANPRP 
SQFTLNGMIC NVDS