Gene Cphy_3550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3550
Symbol
ID	5742954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4383170
End bp	4384411
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	36%
IMG OID	641294661
Product	hypothetical protein
Protein accession	YP_001560638
Protein GI	160881670
COG category	[S] Function unknown
COG ID	[COG4856] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0348411
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGG TAATAACTAG AAATATACCG CTTAAAATCA TATCTTTCCT TATCGCAGTG 
TTATGTTGGG TAATGATTAT GAATATTTCA GATCCCTACA TAACCAGTAC GATTGATAAT 
ATTGAAGTTA AAACCATTAA CACGGAGACT ATGGAACAAC ATAACAAGCG TTATGATGTA 
GAGTCTGGCG ATATTATCTC AATAAAGGTT CGGGGAAAAC GCTCGATTAT CGACGGATTA 
AAGAATACTG ACTTTATAGC GGTTGCTGAT TTTAAAGAGA TGTCTATGGT GGATGCTGTA 
CCTATTCATG TATCACCAAA GCAATCTTAC AGATACAATG CAGATGAAAT AGAGATTCTA 
GAGCAGACAC AGATGATGAA ACTGACACTA GAAGAGTTAG ATAAGCAAAC CTTCCGTGTT 
AATGTTAGAC AGACTGGAGA AGCGAAGGCA GGTTTCTATG TTACGGAATT AATCGCTAAT 
CCAAGCATTA TCGAAATCTC TGGATCGAAA AGAAAGATTG CTAAAATTAA GGATGTAGTT 
GTTGAGGTTA ACGTTGAACA GGTAAGTAAC TCTTATCAAG TTACAAAAAA ACTAGTTGCT 
TATGATGAGA ATGGATATAT TATAGACTCT GAAAAACTTG ATTTTGAGAC TAAAGAAGCA 
ACGATAGATG TGACTGTGCT ACCAACAAAG ACAATACCAA TTCAAGTATC TGCAGTTGGA 
ACTCCTGCAT ATGGCTATAA ATGCACCGAC GTTGTTTGGG AGCCAAAAAC CATTACCATT 
GCTGGAGAGC AAAAAGATCT GAATAAGATT TATTGGTTAA AGCAACAGAT AGACATTAGT 
GGTAAGAAAG AAACCTTCCC AGAGAAAAGA AATATTGAAA CAATCTTAGA AGATACTTAT 
CCAGGAATGT ATACTTTAGT CGATGAAAGT AATACCTTTG ACATCACGGT TAAGATTGAC 
CAGTTAGGTA GCAAAGATAT AACGATACCG ACGTCAGACA TTCAGGTTAG AAATTTAGAT 
CCTGATTATG AAGTTATTTT TAGGACACTT GGTAATATAA ATGTACGCGT CAGAGGTGTT 
TCAGGATCGT TAAATGAGGT ATCTGCATTA ACGATACGGC CATATATAGA TGTAACAAAT 
TATGGACTGG GAGTCCATTC GGTTACGGTA CAATATAAAT CAAATGAGGA ACTCACAATT 
CAGCCTGTTA CGATTAGTAT TGAAGTGGTG AAGAGAGAAT AG

Protein sequence

MKKVITRNIP LKIISFLIAV LCWVMIMNIS DPYITSTIDN IEVKTINTET MEQHNKRYDV 
ESGDIISIKV RGKRSIIDGL KNTDFIAVAD FKEMSMVDAV PIHVSPKQSY RYNADEIEIL 
EQTQMMKLTL EELDKQTFRV NVRQTGEAKA GFYVTELIAN PSIIEISGSK RKIAKIKDVV 
VEVNVEQVSN SYQVTKKLVA YDENGYIIDS EKLDFETKEA TIDVTVLPTK TIPIQVSAVG 
TPAYGYKCTD VVWEPKTITI AGEQKDLNKI YWLKQQIDIS GKKETFPEKR NIETILEDTY 
PGMYTLVDES NTFDITVKID QLGSKDITIP TSDIQVRNLD PDYEVIFRTL GNINVRVRGV 
SGSLNEVSAL TIRPYIDVTN YGLGVHSVTV QYKSNEELTI QPVTISIEVV KRE