Gene Cphy_3011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3011
Symbol
ID	5743337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	3676460
End bp	3678076
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	39%
IMG OID	641294112
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_001560107
Protein GI	160881139
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGA TAAAAGTTTC GAATCCTATT CTTTCTGGAT TCTATCCAGA CCCATCCATA 
GTCCGCGTCG GACAGGATTA CTATATGGTA AATTCCACAT TTTCTTACTT CCCAGGGGTA 
CCTTTATCTC ATAGTACTGA CTTAATTCAC TGGGAACAGA TAACAAATAT TCTATCTACT 
AAAAAACAGT TGAATCTTGC AAATTCTCCT CATAGTGGTG GTATCTATGC TCCAACCATC 
CGCTATCATA AAGGTACTTT CTATATGATT ACTACCAATG TTTCTCATGG AGGAAATTTT 
ATTGTAACTG CAACCAATCC TCTCGGACCT TGGTCAGAAC CTTACTTTTT AAATGGTGCA 
GAGGGAATTG ATCCTTCCCT TTTCTTTGAT GAAGACGGAA CTTGCTATTA TTGTGGAACG 
AAAGGCCGCA GAGAAGGATC TGCTTTCTTC GGTGATAATG AGATTTATGT ACAAGAAGTT 
GACTTAACTA CCATGCAGTT AACAGGCGAA TCTTATGCCA TATGGCACGG TGCCCTAAAA 
GGAGTTGAGT GGCCAGAAGG TCCGCATATT TATAAACGTG ATGGTTGGTA TTATCTCATG 
ATTGCAGAGG GTGGTACAGG ACTAAATCAT GCTATTACTA TGGCTAGAAG CAAGAATATA 
AAAGAAACGT TTGAAGGATG CAAAAGAAAC CCTATCTTCA CTCATCGTCA TCTTGGAAAA 
CAGTATTGGG CAATCAATAC CGGGCATGCT GATATCGTAG AGACAGAACA CGGAGACTGG 
TATATGGTAT TGCTTGCAAG TAGGCCATGT GATGGTTACT GCTTACTTGG AAGAGAGACT 
TTCCTGGTTC CACTCATCTG GGAAGATGGA TGGCCTATTG TAAATCCAGG TGTTGGACTT 
TTAGATAGAA TAGTTACTAT CCAAGTAAAG GATTCTTCTA CTTTAGTGGA AGCCAATGAG 
GCACAAGTAG GTGAAAAAGA ATTAGATTCT CTTTTAAAAG ACTACCATCC AACTTGTAGA 
GATATTAAAG AAAATTTCCG TCAGAAGGAT TTGCCTCCTT ATTTCTTCTA CTTAAGAAAT 
CCTCAGGAAG ATCACTATGA AACAGGCAGA GAAACTGGTC TTCGCTTATA CGCCAGTGAT 
GTATCACTCA CAGCAGATGC TTCTCCAACA GCGCTCTTTC TTCGCCAGAC TTCTATTAAT 
TACACACTGG GTACCAAACT AGAATCCACT CTAACGAATG AAAATAGTGA AGCTGGTATC 
CTCCTAATGC AAAGTAATCA TTTTCATTAC CGTTTTTGTA TCTATAAGAG TAACGTTCCT 
ATGGTTGTAT TAATATCTTG TATCGAGGGA AAAGAGCAGT TTTTAATTAA GAGAGAATTG 
TCGAAATTCC CTTCCTATCT GCAGGTGAGG GAAGAAGACC TAAACTTAAG CTTTTTCTAC 
TCTTTCGATG GAACAGAATA CCAAACTGTT GCTGCTTCGA TTGATGCGAG TATCCTTAGC 
ACAGAACGTG CTGGCGGCTT TGTTGGTACC TGCCTTGGTT TATATACCTA TACACCTACC 
AAGGAATTTG GAGAGGATTT TGTAGATTTT GATTATCTGC ATTATCAGGT AATGTAG

Protein sequence

MKQIKVSNPI LSGFYPDPSI VRVGQDYYMV NSTFSYFPGV PLSHSTDLIH WEQITNILST 
KKQLNLANSP HSGGIYAPTI RYHKGTFYMI TTNVSHGGNF IVTATNPLGP WSEPYFLNGA 
EGIDPSLFFD EDGTCYYCGT KGRREGSAFF GDNEIYVQEV DLTTMQLTGE SYAIWHGALK 
GVEWPEGPHI YKRDGWYYLM IAEGGTGLNH AITMARSKNI KETFEGCKRN PIFTHRHLGK 
QYWAINTGHA DIVETEHGDW YMVLLASRPC DGYCLLGRET FLVPLIWEDG WPIVNPGVGL 
LDRIVTIQVK DSSTLVEANE AQVGEKELDS LLKDYHPTCR DIKENFRQKD LPPYFFYLRN 
PQEDHYETGR ETGLRLYASD VSLTADASPT ALFLRQTSIN YTLGTKLEST LTNENSEAGI 
LLMQSNHFHY RFCIYKSNVP MVVLISCIEG KEQFLIKREL SKFPSYLQVR EEDLNLSFFY 
SFDGTEYQTV AASIDASILS TERAGGFVGT CLGLYTYTPT KEFGEDFVDF DYLHYQVM