Gene Cphy_3504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3504
Symbol
ID	5743615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4322606
End bp	4323628
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	34%
IMG OID	641294614
Product	polysaccharide biosynthesis protein CapD
Protein accession	YP_001560592
Protein GI	160881624
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1086] Predicted nucleoside-diphosphate sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAAAG AAAAAACTTT ATTAATAACT GGTGGAACAG GCTCCTTTGG TAATGCTGTG 
CTTGAGAGAT TTCTTAATAC CGACATAAAA GAGATTCGCA TATTCTCTAG AGATGAAAAG 
AAACAAGATG ATATGCGACA TAAATATAAT AATGATAAAA TTAAATATTA CATAGGAGAT 
GTCAGGGATT TACAAAGCAT TAAAAATGCT ATGCATGGTG TTGATTATGT TTTTCAAGCT 
GCAGCTTTAA AGCAAGTACC ATCATGCGAA TTTTTTCCGA TGGAAGCAGT AAAGACTAAC 
ATCATAGGTA CAGACAATGT ATTAACAGCT TGTATAGAAG AGGGAGTGAA AAAGGTAATC 
TGTTTATCCA CAGATAAAGC AGCTTATCCT GTCAATGCCA TGGGGACGTC GAAGGCTATG 
ATGGAAAAGG TTTTTGTAGC GAAGTCGAGA ACAGTAGATC CAAACAAAAC GTTAATATGT 
GGAACTCGTT ATGGTAATGT AATGTGCTCA AGGGGATCTG TAATACCATT ATTTATAGAA 
CAAATAAAAG CTGGACAACC ACTTACTGTG ACAGAACCCA CAATGACTCG ATTTATTATG 
AGCTTAGAAG AGGCTGTTGA GTTGGTTATA TTCGCTTTTC ACCATGCTGA AAGTGGAGAT 
ATTATGGTTC AAAAGGCACC GGCAACAACT ATCGGAGTCT TGGCTCAAGC AATAAAAGAA 
TTGTTTAATG TCGATAACGA AATAAAAACT ATAGGAATAC GCCATGGAGA AAAAATGTAT 
GAAACATTAT TAACTAATGA AGAGTGTGCA CATGCAATAG ATATGGGCAA CTTTTATCGT 
GTTCCTGCAG ATAAACGAGA TTTAAATTAT GATAAGTATT TTAAAGTTGG AGATCAAGGA 
AGAGAAAAAT TATCTGAATT TAATTCTAAT AATACGCAGC TACTTACTAT AGAACAGACG 
AAAGAAAAAT TATTAACATT ATCCTATATA AGAGAAGAAA TAGAAGCTTG GGAGAACCGA 
TAA

Protein sequence

MFKEKTLLIT GGTGSFGNAV LERFLNTDIK EIRIFSRDEK KQDDMRHKYN NDKIKYYIGD 
VRDLQSIKNA MHGVDYVFQA AALKQVPSCE FFPMEAVKTN IIGTDNVLTA CIEEGVKKVI 
CLSTDKAAYP VNAMGTSKAM MEKVFVAKSR TVDPNKTLIC GTRYGNVMCS RGSVIPLFIE 
QIKAGQPLTV TEPTMTRFIM SLEEAVELVI FAFHHAESGD IMVQKAPATT IGVLAQAIKE 
LFNVDNEIKT IGIRHGEKMY ETLLTNEECA HAIDMGNFYR VPADKRDLNY DKYFKVGDQG 
REKLSEFNSN NTQLLTIEQT KEKLLTLSYI REEIEAWENR