Gene Cphy_1711 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_1711
Symbol
ID	5741462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2101420
End bp	2103282
Gene Length	1863 bp
Protein Length	620 aa
Translation table	11
GC content	35%
IMG OID	641292811
Product	endopygalactorunase-like protein
Protein accession	YP_001558822
Protein GI	160879854
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA GAATAGACAA TATTTATATG CCAATCGATA TAGAACCTAA TAAAAATTTT 
TCTGTAAAAG TTAGAAGTGA AAACGATCAA CAGTGGCAAG AATTATTTGT TTACAATGTG 
AGGGTAGGCC ACCAACAAAC ACCTTATGTA AACAGTGGCA TGGTCAAGTT TGATTTTGAA 
GGAGCCATAG AAATTAGTAT AGATTATAAT GTCAGTGATA TAGCATCCTA TGAGATAAGA 
CCAACCTCTT ACCATATTAG TGGGAAGCAG GAAGAAAGAA ATATTAAATT CAAGTTACAT 
CAGGATGGAG AGAATTCTAA AAAATTAGTT GTAAGAATAA ACGATAATTG GGAGACCGCT 
TGTTTGCACA TTTTGTCAAA TCCTATAGAG GAAGAAAAGC CAGTTAAGTA TGCTGAAAAT 
ATTCACATAA TAAAGGCAGG TGATGAAATT CCTTTTTATT TACCAAAAGG GAAGGATACC 
TATTATTTTG AAGAAGGAAT ACATGTTCTG CCTGGAGGCT TATGGATGGA ACATGATTTA 
AAGAGAGTAT ATACAATCGA CAGATTTTTA ATAGAGCAAA GCCCTATTGT TTTATTAGGA 
TACGCCGATG GATTAAGTTG TGAGATGCCA CAAAAATACA TAGTGGAAGG CAAAGAAACA 
GAGGAAGAAC ATTATAAGAT ATTATTTGAT GGTAGAGATA ACTTGGCGCT TGGCATGATA 
GAAGAAAAAA TTGCGTCTAT TAATGTAAGA TATGTAAGAA TACGTTTACT GGGAAGTATA 
GGTGAGCGTT TTAGATACTC CAATGCGATA AAACAATTTA GAGTATATAA GGAGAATAGT 
CATGAGGATT TAACAGTTCA GGCAGAGACA AGAGCAGCCA CTCCTAGTAT ACTGAATGGA 
AAAGGAGTCT CTGAAACAGG ATACAGTAAT TGGCATGCAG CAGAAAGCTT TTTCTTGTGT 
CAGGATCATT ATAAAGTGTA TTTAGCAAAT GGATCTGTTG TTAAGGGGGC ATTTGCGTCA 
GATGAAGTCA ACCATATTAA AATATATGGC AGAGGTATTT TGGATTGCAC AGAGCTTAAA 
CATTTTTTTA GGGTAGGGAG TGAAGATCGT ACAGGTGCTA TATGGCTTAT TAGTGGAAAG 
AATTTAGAAG TAGAAGGAAT CACTGTATTA GATCCTCCTA TGTGGTCAAT CGTGTTAAAT 
AATGGTGAAA ACATTAAGGT TAGAAATGTA AACCTCATAG CATCAGCGTT AAATGCGGAC 
GGTATACATT TTAGCAGTAG TTCCAATGTT GAAATAGAGA ATTGTTTTAT AAGAACTTGT 
GATGATTTGA TTGTATTGTA TCATTATGGA AAAGCACAGA ATATTACCGT AAAAAACTGT 
GTATTATGGA GTGATGATGG TCATGCGTTT TTGTTTGGTC TAGGAAGTGT GAAAGATGCC 
CCTATAAAGA ATATAAAAGT ATATCAATGT GATATTATTG ATCATAGAGC AGCCTGGGAT 
TTTATTAAAT ATTCCGGTGC AATTAAGTTG TGGCCAAACG GGGGAAATCT TATGGAGGAT 
GTTGTGTTTG ACACGATTAA TATTGATAGT TTTCAAATGC CAGAGAAAGC ATCCGTATTT 
AAATTAACTA CTCATGAACG CCTTGAAAAT GAGGGGCATG GCATTTTAAA GAATGTTCTA 
CTAAAAGACA TATATTATTG GGGATCAGGA GAGCAAAATG CATTAATCCA AGGAGTTAAT 
GAGGCATTTC ATATTGAAAA TGTCAAGATA CAAAACTACT GTAGAAACGG TGTGAGAGTG 
AAGGATACGA ATGATGGGCA CATTACAGTA AGTGGTTGTG TTAATGGGTT AACAATAGAG 
TGA

Protein sequence

MKNRIDNIYM PIDIEPNKNF SVKVRSENDQ QWQELFVYNV RVGHQQTPYV NSGMVKFDFE 
GAIEISIDYN VSDIASYEIR PTSYHISGKQ EERNIKFKLH QDGENSKKLV VRINDNWETA 
CLHILSNPIE EEKPVKYAEN IHIIKAGDEI PFYLPKGKDT YYFEEGIHVL PGGLWMEHDL 
KRVYTIDRFL IEQSPIVLLG YADGLSCEMP QKYIVEGKET EEEHYKILFD GRDNLALGMI 
EEKIASINVR YVRIRLLGSI GERFRYSNAI KQFRVYKENS HEDLTVQAET RAATPSILNG 
KGVSETGYSN WHAAESFFLC QDHYKVYLAN GSVVKGAFAS DEVNHIKIYG RGILDCTELK 
HFFRVGSEDR TGAIWLISGK NLEVEGITVL DPPMWSIVLN NGENIKVRNV NLIASALNAD 
GIHFSSSSNV EIENCFIRTC DDLIVLYHYG KAQNITVKNC VLWSDDGHAF LFGLGSVKDA 
PIKNIKVYQC DIIDHRAAWD FIKYSGAIKL WPNGGNLMED VVFDTINIDS FQMPEKASVF 
KLTTHERLEN EGHGILKNVL LKDIYYWGSG EQNALIQGVN EAFHIENVKI QNYCRNGVRV 
KDTNDGHITV SGCVNGLTIE