Gene Cphy_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3820
Symbol
ID	5744772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4676284
End bp	4677741
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	38%
IMG OID	641294932
Product	PGAP1 family protein
Protein accession	YP_001560906
Protein GI	160881938
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0412] Dienelactone hydrolase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.233276
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGG TATTATTGGG TTTGGTCTGC AGTCTATTTA TCCTAAGTAT GGTCTCGTGT 
AAAGGAAAGA GTAATCAAAC TGACCAGACA ATAAGTGATG GGGAACTGAC AGTGACACCA 
ACGATAACAG AAGCAAACAT TACGGAAATA CCTAACGAAA CACCGACACC GGGTCTTATC 
GACTCTGTAG AATTTAGTGA GAATGGTTTG GAGGATCTTT CAGCAAAGTT AACGCACGAT 
TTATTAACAG AGAATTTTGA AGAAGTCTAT TCCTATCTTG AGGATACAGT CAAAGAGCAA 
TTATCATTGC CAGACTTAGA GAAAGCCTTT CATAGCACTG TTGAGCGAAT TGGTGAGTTA 
GTTGATGCTA TCTCTATAAA GGCTACAACA ACGGGTGAGT ATATCTCAGT AGATAGTTTA 
GTAGAATATA CAGAGAATGG TTTAAAGATA TCTTATGTCT ATAATAAAGA CTGTAAGTTA 
GTAAAACTAT GGTTCTCTTA CCAACCAATT GAGGAAGAAT ACGATCGTGA AAAGATGGAG 
GAAATCGACA TCACTATAGG TATCACGAGC GGTGTCACTG TTGGTGAGGG AGAATTTCCG 
CTTGATGGTA TTTTAACGAT GCCAAAAGGT ATAAAAAATC CACCTGTCGT AGTCTTAGTA 
CAGGGGTCAG GACAGAGTGA TATGGATGAA ACCATTGGCG GAACAAGCAA TAAGCCATTT 
CGTGATATCG CAAGAGGATT AGCAAGTGAG GGGATTGCCT CTATCCGTTA CAATAAAAGA 
TTCTATCAAT ATATGGATCA AGCCTCCGAT ACAATGACAA TTTATGATGA GGTATTAGAG 
GATGTTACTT ACGCCATTCA ATATGCTAAG AGTCTAACAA ATGTAAATAC GGAAAAGATA 
TTTGTACTTG GGCATAGTTT AGGAGGTATG TTATGTCCAA AGATAGCGGA AGATAATTCG 
GATATCGCAG GATTTATCTC CTTAGCAGGA AGTCCAAGAA AATTAGAAGA TCTATTACTT 
GATCAATCGA TTGAGGCGGT AGAGAATGGT ACGGTGAGTG AGTCGGAGAA AACACTCTAT 
CTAGATACTA TGAAGGCTCA ATATGAGCAG ATTAAAAGCC TTACAGAGGA AAACCTAGAT 
GAGCCACTTC TTGGGGCAAA CGGATACTAC TGGAAGAGTT TGAATGATAT AGATACTCCT 
AAAATCGTAG CAAATCTAAC CCTGCCAATG TTATTTATGC AGGGAGAAGC AGATTTTCAA 
GTGTATCCTG AAGTAGATTT TAAGATGTGG AAGGATCTAC TACAAGAGAA AGACAATGCA 
ACATTTCAAT TGTATGAAGG CTTAAATCAT TTATTTATGC CAACAACAGG AGTACGTGAT 
ATAAGCGACT ACAGCGTAAA GAACAAGGTA GATGATAAAG TGATTCTAGC AATTGCAGCG 
TGGGTTAAGG AACATTAG

Protein sequence

MKKVLLGLVC SLFILSMVSC KGKSNQTDQT ISDGELTVTP TITEANITEI PNETPTPGLI 
DSVEFSENGL EDLSAKLTHD LLTENFEEVY SYLEDTVKEQ LSLPDLEKAF HSTVERIGEL 
VDAISIKATT TGEYISVDSL VEYTENGLKI SYVYNKDCKL VKLWFSYQPI EEEYDREKME 
EIDITIGITS GVTVGEGEFP LDGILTMPKG IKNPPVVVLV QGSGQSDMDE TIGGTSNKPF 
RDIARGLASE GIASIRYNKR FYQYMDQASD TMTIYDEVLE DVTYAIQYAK SLTNVNTEKI 
FVLGHSLGGM LCPKIAEDNS DIAGFISLAG SPRKLEDLLL DQSIEAVENG TVSESEKTLY 
LDTMKAQYEQ IKSLTEENLD EPLLGANGYY WKSLNDIDTP KIVANLTLPM LFMQGEADFQ 
VYPEVDFKMW KDLLQEKDNA TFQLYEGLNH LFMPTTGVRD ISDYSVKNKV DDKVILAIAA 
WVKEH