Gene Cagg_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1689
Symbol
ID	7268991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2061309
End bp	2063168
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	57%
IMG OID	643566531
Product	glycoside hydrolase family 3 domain protein
Protein accession	YP_002463026
Protein GI	219848593
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGC AATATCTGCT TTGTCTTGTG ATGTTGGTCG GCGTATTTGG CGCTTGTGGG 
ACGCTGAATG CACCCCCCGC TACACCGACA CCGGTCATAC CGCTCTACCG TAATCCGGCA 
GCACCTATCG CCGAGCGGGT CGAGGATCTG CTACAGCGGA TGACATTGGC CGAGAAGATC 
GGCCAGATGA CGCTGATCGA AAAAAATAGC ATCACCGCCG ATCAGGTACG TGAATTGGCC 
ATCGGTGGTG TGCTCAGCGG TGGCGGTGGC TATCCAGACG ACGAGAACTC GCCGATGGCG 
TGGGTGGAGA TGGTTAATGC CTTGCAACAG GCGGCATTGA ATAGCCGGCT CGGCATTCCG 
ATCATCTATG GGGCTGATGG TGTTCACGGA CACAACAACC TCTACGGTGC CGTCATCTTT 
CCGCATAACA TCGGGTTGGG GGCAGCGAAT GACCCCGCAC TGGTCGAGCA GATCGGGCGG 
GTGACGGCCC GCGAGATGGC GGCTACCGGT GTCTTTTGGA ACTACGCGCC GGGGGTGATG 
GTAGTGCAAG ATGTGCGTTG GGGGCGTACC TACGAAAGCT ATGCCGAACG TCCTGAACAC 
GTTGCATCGT TGGCAGTCGC TTTTTTGCGT GGCTTGCAAG CTCCCGATAT TGCAGCACCA 
AACCGGATCA TCGGCACTCC CAAACACTAT GTCGGTGATG GCGGTACGAC ATGGGGCACG 
TCAACCACGG CAAACTATCA ACTCGATCAG GGGGAGACGT TTGGTGATGA AACCACGATC 
CGAACCGTGC ATCTCCCACC GTACCGCGCG ACCATCGCTG CCGGTGCGCA TGTGATTATG 
GCGTCGTATT CGAGCTGGAA CGGACAGAAG ATGCACGCCA GTTCGTATTG GCTCACCAAT 
GTGCTGAAAG AAGAACTCGG CTTTACCGGT TTTATTGTCT CAGATTGGGA AGCCATCGAT 
CAGATTGATC CCGACTATGA ACGGGCGGTG GTGACGGCCA TAAATGCCGG GATCGATATG 
AATATGGTGC CTTACGATGC GGTGCGCTTC ATCGAGACCC TGACTCGCGC CGTCAATACC 
GGTATGGTGA GCGAAACGCG GATTGACGAT GCGGTGCGAC GAATCTTGAC GACCAAGTTT 
GCGATGGGGT TATTTGATCA ACCTTTCGCC CACACCGAAC TACTGGGCGA CATCGGTAGT 
CCGGCCCACC GCGCATTAGC CCGTACCGCC GTTGCCCAAT CGTTGGTCTT GCTCAAAAAT 
GACGGTAACC TCCTCCCCTT ACCGAAAGAT GTTGCCCATC TCTACATCGG TGGGCAGGCT 
GCTCACGATC TCGGTATCCA AGCCGGCGGC TGGACAATTG AGTGGCAAGG GAAGCCGGGT 
GCGATTATCC CGGGAACGAC GATTCTCGAA GGGATTCAAG CGGCTGTTAC AGCACAAACG 
GTCATTGAGT ACGATCCACA CGGACGGTTT CGCGGTGATC CGATGGCGAC CGATGCCGTC 
TGCATTGCGG TCGTCGGCGA ATTGCCTTAC GCCGAAGGAC GCGGCGACAG CGCAACCTTA 
CGCTTACCAC CGAACGAACA GCGCACACTG CGTCGGATGG AGGAAAGCTG TGCCCGTCTC 
ATTGTCGTAC TCGTCAGTGG CCGTCCGCTG ATCATCACCG ACGATCTGCC TCGTTGGGAT 
GCGCTTGTCG CCGCGTGGCT ACCCGGTAGC GAAGGGGCCG GTGTCGCCGA TGTTCTGTTT 
GGCGATCAAC CATTTCGCGG GCGATTACCG GTGACGTGGC CGCGCAGCCT CGATCAATTA 
CCGCTCGGAT CAGGAAGCGG CGAGCCACTC TTTCCCTATG GATTTGGACT AACCCCATAA

Protein sequence

MRLQYLLCLV MLVGVFGACG TLNAPPATPT PVIPLYRNPA APIAERVEDL LQRMTLAEKI 
GQMTLIEKNS ITADQVRELA IGGVLSGGGG YPDDENSPMA WVEMVNALQQ AALNSRLGIP 
IIYGADGVHG HNNLYGAVIF PHNIGLGAAN DPALVEQIGR VTAREMAATG VFWNYAPGVM 
VVQDVRWGRT YESYAERPEH VASLAVAFLR GLQAPDIAAP NRIIGTPKHY VGDGGTTWGT 
STTANYQLDQ GETFGDETTI RTVHLPPYRA TIAAGAHVIM ASYSSWNGQK MHASSYWLTN 
VLKEELGFTG FIVSDWEAID QIDPDYERAV VTAINAGIDM NMVPYDAVRF IETLTRAVNT 
GMVSETRIDD AVRRILTTKF AMGLFDQPFA HTELLGDIGS PAHRALARTA VAQSLVLLKN 
DGNLLPLPKD VAHLYIGGQA AHDLGIQAGG WTIEWQGKPG AIIPGTTILE GIQAAVTAQT 
VIEYDPHGRF RGDPMATDAV CIAVVGELPY AEGRGDSATL RLPPNEQRTL RRMEESCARL 
IVVLVSGRPL IITDDLPRWD ALVAAWLPGS EGAGVADVLF GDQPFRGRLP VTWPRSLDQL 
PLGSGSGEPL FPYGFGLTP