Gene Cphy_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_1125
Symbol
ID	5741960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	1418251
End bp	1419804
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	38%
IMG OID	641292230
Product	glycoside hydrolase family 3 protein
Protein accession	YP_001558242
Protein GI	160879274
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTTAT CAATAAGAGG AAAAGTTGGA CAACGAATTG TAGCAGGATT TCCTGGTACT 
ACGATCGATA GTGAATTAGA GGATTTTATC CGTACCTATA AGATTGGGAA TTTCATTTTA 
TTTAAAGAAA ATATTGTAGA TGCGAATCAG TTAAGTAATC TATGTGAGGG ATTACAGCAG 
CTTACAAAAA AATATACCGG ACATAGAGCA TTTATAACGA TAGATCAAGA GGGTGGAATG 
GTAACAAGAC TATCCGAAGA TAGTGTTAAT ATTCCTGGTG CGATGGCGAT TGCTGCAACT 
AGGGATGAAA AAAATGCTTA TATGGCAGGA AGGATTACTG GTCAGCAATT GAGAACCTTA 
GGGTTTAACT TTGATTTAGC ACCTGTGGCA GATATCAATT CCAATATGGA TAATCCGGTC 
ATTGGGGTAA GAAGTTATGG TGATGAACCA GATCAGGTAG CAAAATACTG CGTAGCCATG 
ATGAAAGGTC TTACCGATGG AGGGGTGCTG GCTTCAGCGA AGCATTTCCC AGGGCATGGA 
GATACCAATG TAGATTCTCA TCTTGGGTTA CCGAAGGTAC ATAAGTCATT AGAGGAGATG 
GAGCTGTGCG AATTAGTTTC ATTTAAAGCA TTGATTGAGG CAGGAATACC GGCAATCATG 
TCATCCCATA TCATTTTCCC AGCCTTAGAA GAGGAACTTC CAGCAACGAT GTCAAGAAAG 
ATTATCACAG GACTCTTAAA GGAGAAGCTT GGATTTAAAG GGTTAGTTAT TAGTGACTGT 
ATGGAAATGA GTGCGATTAA GAAATACTAT GGATCAATTG AGGGAATCAA GCATGCGATT 
GAGGCAGGTG TTGATTTAAT CTTTGTATCT CATACCATGA GTGTCGCAAG GGAAGCCTCA 
GATGTATTGA CAGGCTTGTA TGAAAAAGGC GAATTATCTA TGGATGAGAT GGATGCATCT 
ATTGATAAAA TTATGTACTA TAAAGATAAA TGTTTATGCA ATGAGAACGA AAAGCATGAT 
ACCAATGAAT TTGATGTGAA GGCTGGAATT GAATTTACAA AAGAGCTTCT TCGAAAGAGT 
TTAACCCCAA TTCAAATGCC TAGCGATAAC CTACCAGTTG TTGATCATAA TTCCCTATTT 
CTTGGATGTA TGCCATTTAG AGCTACGAAT GTTTTCAATA TAGATGCAGG TGCCTTTCAA 
TTTGCAGATT ATATGGCTAA GTATTTTAAT GGAAATGGTA TTTTAACATC ACCACAACCT 
ACAGACGAAG AGATGGAAGC GTTAATACAA CCAATGAAAG AAGCAAGTAC TGTAGTCATC 
GCAACGTATA ATGCACATCT ATATAAAGAA CAACTAAAAC TCGTTGAACT TGCAGCAAAA 
TCCAATACAA ACGTTATTGT TTTTGCTCTT AGAAATCCAT ATGATTTAAA AGACTTACCA 
GCAAATGTGT ATGGAATTGC TGTCTATGAG TATACCTTAA AGAGTGTAGA GGCATTGGCA 
GAATATATGA AACAGCCATA TGAGTTGAGT GGAAAATTAC CTGTGAAGAT GTAA

Protein sequence

MDLSIRGKVG QRIVAGFPGT TIDSELEDFI RTYKIGNFIL FKENIVDANQ LSNLCEGLQQ 
LTKKYTGHRA FITIDQEGGM VTRLSEDSVN IPGAMAIAAT RDEKNAYMAG RITGQQLRTL 
GFNFDLAPVA DINSNMDNPV IGVRSYGDEP DQVAKYCVAM MKGLTDGGVL ASAKHFPGHG 
DTNVDSHLGL PKVHKSLEEM ELCELVSFKA LIEAGIPAIM SSHIIFPALE EELPATMSRK 
IITGLLKEKL GFKGLVISDC MEMSAIKKYY GSIEGIKHAI EAGVDLIFVS HTMSVAREAS 
DVLTGLYEKG ELSMDEMDAS IDKIMYYKDK CLCNENEKHD TNEFDVKAGI EFTKELLRKS 
LTPIQMPSDN LPVVDHNSLF LGCMPFRATN VFNIDAGAFQ FADYMAKYFN GNGILTSPQP 
TDEEMEALIQ PMKEASTVVI ATYNAHLYKE QLKLVELAAK SNTNVIVFAL RNPYDLKDLP 
ANVYGIAVYE YTLKSVEALA EYMKQPYELS GKLPVKM