Gene Cagg_0717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0717
Symbol
ID	7266969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	888190
End bp	889794
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	58%
IMG OID	643565568
Product	glycosyl hydrolase 53 protein
Protein accession	YP_002462077
Protein GI	219847644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCAC TACTCCATCT GACATTCCTG CTCACCGCTG CTGTGATGTT CGTAGCCGAT 
GCGCCGACCC TACACCGGCC CATCACCCAA CCAATTGCGA TTCGTACCCC AACCGGGCCA 
CTGGCTATCG GAATCAACAG CCATCTGGCA ACTCGTTATC CCGATGCTGC GACAATGGCA 
ATCCCGGCAG CAATCGTCGC CGATCTCGGC GTGCAGTGGG TGCGTGAAGA CCTGCATTGG 
CATCGCATCC AACCCCAACC CGATGTCTGG GATTGGGTAT TTACCGATGC CGCTCTCTAT 
GCGCTCAGCC GTCAGGATGT ACGGATTCTG GGCGTCTTGG GACCGTCCGT CGGCTGGGCC 
ACCGCCGACC CGACCGACCG GCCCAATCTC ATTTCGTTTG CCCCACCCGA TGAAGATGCG 
TTTGTCACGT ATGCCGGTGC CGTCGTCCAA CGCTACAAAC ACCTCATTAA ACACTGGCAA 
ATCTGGAACG AACCCGACCA AACCCTTTTC TGGCGGCCAT CACCCGATCC GGCACGCTAT 
ACCCGCCTCC TGATTGCTAC TGCCCAAACG ATTCGCACGA TTGATCCGAC GGCCACCATC 
GTTCTTGGCG GCATTAACCC TTTCGACACC GGTTTTCTGC GTGCGATTGC TGCTTATGGT 
GGATGGAACG CCTTTGATGT GATCGCCATC CACCCCTACG TCGATCCACT CAATCCAGAA 
GAGGGGAACC TCATTGCTGC TGCGGATGGT GTGCGTGCCG TGGCTGCGCG ATACGGCATG 
AAACCGATCT GGGCCACCGA AGTGGGGTGG GCGAGCGGCC CCGGCGACCG CGATGCGCTT 
GGGCTGACGA ATGCTACGCT TCAAGCTGCG TACCTCTCCC GTACCTACTG TGCGCTCTGG 
TACGGCGGGG TGAGTGCTGT CTTCTGGTAC ATGCTCAAAG ACGATCCGCA CAATCCGTAT 
GGGCTGTTTG CGTATGGGAG CGGACGGGCC GATTTTAGCA CACCCAAACC GGCAGTAACC 
GCGATGCGTG AACTGCCCGA CACACTTGCC GCGTGTCACC TAGAGCCACC CACTACTACC 
ATTCCACTCC TTACCGGCAG CCAACCTGTG CAATGGCGAC GGCCCAGCCA GCCCAACGGT 
TCACTCCGGT TGATCGAACA CGATCGCGTC TTCCACATCA GCTATCGCTT TACAACCCGT 
ATGAATGATT ACGTGGCTTT TGCGCTGAGC AACCCTATCC CCCTACCCGA CGATACAACC 
GCCATCACCG TTCAGCTTTT CGGTGATGGC AATGGGCACC GACTACGGCT CTGGTTACGC 
GACAGCGAAG GCGAAACCTT CTCGCTGACT GCCGGTATTA TCGGCCCACC TGCCTGGCAA 
ACCATCAACA CTCCACTGAG CCGTCGACCG ATGCAGTATG AACTGATTGC CGGGAATGGC 
AACAGGCAAC CTGACGCTCC ACTCGCGTTA GCGGCCATCG TTATCGATGA CGAAGATGAT 
ACCTGGACCG GGATGGGTGA AGTGCTGATC GAGCGCATAG CCGCGGTACG CACCACACTT 
GACGCAGCCT CACTCCCGAC GTATACTGTC ACTCAACGGC GATGA

Protein sequence

MRALLHLTFL LTAAVMFVAD APTLHRPITQ PIAIRTPTGP LAIGINSHLA TRYPDAATMA 
IPAAIVADLG VQWVREDLHW HRIQPQPDVW DWVFTDAALY ALSRQDVRIL GVLGPSVGWA 
TADPTDRPNL ISFAPPDEDA FVTYAGAVVQ RYKHLIKHWQ IWNEPDQTLF WRPSPDPARY 
TRLLIATAQT IRTIDPTATI VLGGINPFDT GFLRAIAAYG GWNAFDVIAI HPYVDPLNPE 
EGNLIAAADG VRAVAARYGM KPIWATEVGW ASGPGDRDAL GLTNATLQAA YLSRTYCALW 
YGGVSAVFWY MLKDDPHNPY GLFAYGSGRA DFSTPKPAVT AMRELPDTLA ACHLEPPTTT 
IPLLTGSQPV QWRRPSQPNG SLRLIEHDRV FHISYRFTTR MNDYVAFALS NPIPLPDDTT 
AITVQLFGDG NGHRLRLWLR DSEGETFSLT AGIIGPPAWQ TINTPLSRRP MQYELIAGNG 
NRQPDAPLAL AAIVIDDEDD TWTGMGEVLI ERIAAVRTTL DAASLPTYTV TQRR