Gene Cagg_3719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3719
Symbol
ID	7268255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4519448
End bp	4520896
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	60%
IMG OID	643568526
Product	Glycosyl hydrolase family 32 domain protein
Protein accession	YP_002464991
Protein GI	219850558
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000148821
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACTAT TTCTGATGAG ATCGAAAGAG CAGGGTATGA TTAGCGACCC GCATCGCCCC 
CGCTACCACT TTTTACCGCT GGCCAACTGG ATGAATGACC CCAACGGGCT GATCCAGTGG 
GGCGAGACGT TTCACCTGTT TTACCAGTAC AATCCCGCTG GAGCGTACCA TCGCAATATC 
CATTGGGGGC ATGCGACGAG CGCCGATTTA CTATATTGGC AACATCAGCC CATCGCCCTT 
GCTCCGACAC CGGGCGGCCC CGATGCCGAT GGTTGCTGGT CGGGTTGCGC AGTCAATGAT 
TATGGCACGC CAACGTTGAT CTATACCGGT TTTCGCTTGC CTGAAGAACA AACTCCTTGT 
CTGGCGGTGA GTCGCGATGG GTTGCTGACG TGGCAGAAGT GGCCGGAACC GATCATTCCC 
GCTCCTCCAG CCGATCTCGA TCTGCTCGGT TTTCGCGATC ATACGGTCTG GCGTGAGAAT 
GGCCGGTGGG CGATGCTGAT TGGCGCCGGT ATTCGCGGTC AAGGCGGCAC GGTGCTGTTG 
TACCGGTCGG ATGATCTGCG CCGCTGGGAA TACGGCGGGC CGCTGGTGAT CGGTGATGCT 
GGCCAGTTCG ATCCAGTCTG GACAGGCACG CTCTGGGAGT GTCCAGACTT TTTTTCGTTA 
AACGGTGATC ACGCACTGAT CTGTTCGGTG TGGGATCGGT GCCCGTATTA CACCATCGCG 
ATGCGCGGTG CGTACCGTGA TGGCCGGTTT ACGCCATCCC TGACTCACAA GCTCGATTAC 
GGCGATGCCC ATTTTTACGC ACCGCAGACG ATGCCGTTGC GCGATGGACG CCGGATCATG 
TTCGGTTGGG TGATGGAGGG ACGGAGCGAG GCGGCGGTGC TGGCCGCCGG TTGGGCGGGG 
GTGATGTCGT TGCCGCGTGA GGTGCAGGTA AGCAGCGATG GGCAGGTAGT GGCGTTACCA 
ATTGCAGAAG TGACGCAATT GCGTGGTATG GAACGGCGAA TGTCGCCTGC CCGGATCATG 
CCCGGTGCGC TACAGTGGAC ACCGATCTGT GGCGCGCATC TTGAGCTAGA GGTGGTATTG 
CTGCCCCCGT CGCAAGGCAC GTGTAGTGTG TGGCTACGGG CCAGCCCCGA TGGGGCTGAA 
GCGACTATTC TGCGCTACAA TCGTGCCACT GCTACTCTCA CCCTCGACCG TAGCCGTTCG 
AGCCTGAGCA GTGATGTCTG GCACGACTCT CACCATGCCC CCTTGCCGTT GGCTCCCGAC 
GAACCGCTTC GCCTCCGTAT CTTTCTCGAC GGCTCGCTGA TCGAAGTCTT TGCCAACGAC 
CGCCGCTCAA TCACCAGTCG TATCTATCCC AGCCGGCCCG ATAGTGACGG GGTTGCTTTG 
CAGGTCGAAG GCAACCCCGC CGAGCTGGTG ATGATGCGGG CGTGGGAAAT GGCCGATATT 
TGGGCGTGA

Protein sequence

MTLFLMRSKE QGMISDPHRP RYHFLPLANW MNDPNGLIQW GETFHLFYQY NPAGAYHRNI 
HWGHATSADL LYWQHQPIAL APTPGGPDAD GCWSGCAVND YGTPTLIYTG FRLPEEQTPC 
LAVSRDGLLT WQKWPEPIIP APPADLDLLG FRDHTVWREN GRWAMLIGAG IRGQGGTVLL 
YRSDDLRRWE YGGPLVIGDA GQFDPVWTGT LWECPDFFSL NGDHALICSV WDRCPYYTIA 
MRGAYRDGRF TPSLTHKLDY GDAHFYAPQT MPLRDGRRIM FGWVMEGRSE AAVLAAGWAG 
VMSLPREVQV SSDGQVVALP IAEVTQLRGM ERRMSPARIM PGALQWTPIC GAHLELEVVL 
LPPSQGTCSV WLRASPDGAE ATILRYNRAT ATLTLDRSRS SLSSDVWHDS HHAPLPLAPD 
EPLRLRIFLD GSLIEVFAND RRSITSRIYP SRPDSDGVAL QVEGNPAELV MMRAWEMADI 
WA