Gene Cphy_2038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2038
Symbol
ID	5743066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2518593
End bp	2519861
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	36%
IMG OID	641293135
Product	amidohydrolase
Protein accession	YP_001559145
Protein GI	160880177
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0984083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTA GATTCTATCA TGCTCGCATC GCTACTATGC AAAACGATTG TGGTATCATA 
GAAGGAGAGC TTTGGGTTAC AAATAATCGA ATCTCTTATG TAGGTACCGA AAGAGAAAGC 
CAGATTTCAT GGGATAGAGA AATTGATTGT AAAGGGAATC TATTAATGCC AGGATTTAAG 
AATACTCATA CGCATTCTGC TATGACATTT CTTAGATCCT ACGCTGATGA TTTACCATTG 
CATGATTGGT TAAATAAACA GGTATTTCCG ATGGAAGCGA AATTATCACC AGATGATATC 
TATCACTTAT CAAAACTAGC CATCTTAGAG TACCTAACTA GTGGTATGAC AGCAAACTTT 
GATATGTATA TTACACCAGA TACGATAGTC CAGGCTTCGA TAGATACTGG ATTTCGAACC 
GTTCTTTGTG GTGGAGTAAG TAACTTTTTG CATTCTGTAA CACAGGTTGA GGATTGGTAC 
AAAAAATACA ATAATTATCA TGAGCTAGTT TCATTTCAAC TCGGTTTTCA TGCGGAATAT 
ACAATAGATA GAGCGACACT TATGGATTTA GCTTCGTTAG CAAAACAGCT AAAAGCTCCA 
GTTTATACCC ATAACTCAGA GACAAAAGCA GAAGTTGATG CATGTATATC AAGAAATCAA 
ATGACTCCAA CTGCATATCT TGATTCCTTA GGTATCTATG ATTTTGGTGG TGGCGGATAT 
CATTGTGTTC ATATGACCGA TGAAGACCTT TACATCGTAA AGAGAAGAGG AGTTTCAGTT 
GTTACAAATC CTGGTTCTAA CACGAAATTA GCAAGTGGAA TTGCACGTAT TGAAGATATG 
TTATCACTTG GAATTAATAT AGCAATCGGA ACAGATGGCC CTGCAAGCAA TAATTGTCTT 
GACATGTTTC GTGAGATGTT CTTAGTTACA GGACTTTCTA AATTAAAGAA TGAAGATGCG 
TCCTCAGTAG ATGCAAATGA AGTTCTTAGG ATGGCAACTG TAAATGGTGC AAAAGCGATG 
TGTCTTACAG ACTGTGATTG TCTCGCTGAA GGAAAATTAG CAGATTTAAT CATGATTAAT 
TTACATCAGC CAAATATGCA GCCAATGAAT AACATTACTA AAAACATTGT CTATAGCGGA 
AGTAAAACCA ATGTTAAATT AACAATGGTC AATGGCAAGA TACTCTATGA AAATGGTGAA 
TTTTTCGTAG GAGAAGATCC AGAGGCTATT TATGCGAAGG CGAATGAAAT AATAAATCGT 
ATGAGATAA

Protein sequence

MNIRFYHARI ATMQNDCGII EGELWVTNNR ISYVGTERES QISWDREIDC KGNLLMPGFK 
NTHTHSAMTF LRSYADDLPL HDWLNKQVFP MEAKLSPDDI YHLSKLAILE YLTSGMTANF 
DMYITPDTIV QASIDTGFRT VLCGGVSNFL HSVTQVEDWY KKYNNYHELV SFQLGFHAEY 
TIDRATLMDL ASLAKQLKAP VYTHNSETKA EVDACISRNQ MTPTAYLDSL GIYDFGGGGY 
HCVHMTDEDL YIVKRRGVSV VTNPGSNTKL ASGIARIEDM LSLGINIAIG TDGPASNNCL 
DMFREMFLVT GLSKLKNEDA SSVDANEVLR MATVNGAKAM CLTDCDCLAE GKLADLIMIN 
LHQPNMQPMN NITKNIVYSG SKTNVKLTMV NGKILYENGE FFVGEDPEAI YAKANEIINR 
MR