Gene Cphy_1163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_1163
Symbol
ID	5742886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	1475031
End bp	1476437
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	36%
IMG OID	641292268
Product	cellulase
Protein accession	YP_001558280
Protein GI	160879312
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA TCAGAAGAAT AGTTTCATTG TTTTTGATTG TAACAATCTT TATCACGACA 
TGCTTTTTTA ATGTTGGTCA AAAGGTATAT GCTGCTGATA CGAATAATGA TGATTGGCTA 
CATTGTGTAG GCAATAAAAT TTATGACATG AATGGCAATG AGGTTTGGCT GACCGGTGCG 
AATTGGTTTG GTTTTAACTG TACTGAAAAT GTATTTCATG GTGCATGGTA CGATATTAAG 
GGGATGTTAA CTAATATTGC AAACAGAGGA ATAGGATTTT TAAGAGTTCC AATTTCAACG 
GAACTTTTGT ATAGTTGGAT GATAGGCAAA CCTAATAAAG TTTCAAGTGT GACCGCTGTC 
AATAATCCAC CTTATTATGT ATGCAACCCT GATTTTTATG ATCCTACAAC AAATAGTGTT 
AAAAATAGTA TGGAAATATT TGATATCATT ATGGGATACT GCAAACAATT GGGGATCAAA 
GTAATGGTAG ATGTTCATAG TCCGGATGCA AATAATTCAG GTCATAACTA TCCGTTATGG 
TATGGGTTAA CTACGACTAC TGCAGGTGAA ATAACGACAG ATAAGTGGAT CAATACTCAA 
GCATGGCTGG CTGATAAATA CAAAAATGAC GATACTATTC TGGCATTTGA TATAAAAAAT 
GAACCTCATG GACAGAGGGG ATATAGTACT ACAACACCTA CTAATATAGC AAAATGGGAT 
AATTCCACAG ATGAGAATAA CTGGAAGTAT GCGGCGGAAA GATGTGCGAA AGCTATACTT 
GCTAAAAACC CTAAATTATT AATTATGATT GAAGGTGTTG AACAATACCC TAAAACTGAA 
AAAGGTTATA ACTATAATAC ACCGGATGTA TGGGGAGCTA CTGGTGATCA GTCTCCATGG 
TATAGTGCTT GGTGGGGTGG AAATTTAAGA GGAGTAAAGG ATTATCCAAT TAATATAGGC 
ACTCTCAATA GTCAGATCGT CTATTCCCCT CATGACTATG GTCCTTCCGT ATACAACCAA 
CCATGGTTTG ATAAGGATTT TACAACTCAG ACCCTATTAG ATGATTATTG GTATAATACT 
TGGGCATATA TTAAAGATAA AGGTATTGCA CCACTTTTGA TAGGTGAGTG GGGAGGTTTT 
ATGGATGGTG GAAAGAACCA GAAATGGATG ACATTATTAA GAGATTATAT AGTAAATAAT 
CGTATCCACC ATACATTCTG GTGTATCAAT CCGAACTCAG GGGATACTGG AGGTTTACTA 
GGATATGATT GGCAAACTTG GGATGAAGCA AAATACGCTT TATTAAAACC TGCATTATGG 
CAGTCAAATG GTAAATTTAT TGGTCTAGAC CATCAGACAC CTCTTGGTGT AAATGGTATA 
TCATTAGGGC AATATTATGG AAAATAA

Protein sequence

MSKIRRIVSL FLIVTIFITT CFFNVGQKVY AADTNNDDWL HCVGNKIYDM NGNEVWLTGA 
NWFGFNCTEN VFHGAWYDIK GMLTNIANRG IGFLRVPIST ELLYSWMIGK PNKVSSVTAV 
NNPPYYVCNP DFYDPTTNSV KNSMEIFDII MGYCKQLGIK VMVDVHSPDA NNSGHNYPLW 
YGLTTTTAGE ITTDKWINTQ AWLADKYKND DTILAFDIKN EPHGQRGYST TTPTNIAKWD 
NSTDENNWKY AAERCAKAIL AKNPKLLIMI EGVEQYPKTE KGYNYNTPDV WGATGDQSPW 
YSAWWGGNLR GVKDYPINIG TLNSQIVYSP HDYGPSVYNQ PWFDKDFTTQ TLLDDYWYNT 
WAYIKDKGIA PLLIGEWGGF MDGGKNQKWM TLLRDYIVNN RIHHTFWCIN PNSGDTGGLL 
GYDWQTWDEA KYALLKPALW QSNGKFIGLD HQTPLGVNGI SLGQYYGK