Gene Cphy_3622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3622
Symbol
ID	5742646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4473568
End bp	4474779
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	36%
IMG OID	641294732
Product	amidohydrolase 3
Protein accession	YP_001560708
Protein GI	160881740
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.495832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTGGA TTAAGAATGT GCTTCTTGAG ATAGGAAGAG AAGAAATTGT AAAAGATACA 
ATGGAAACAA AGACAGAACA AGTTTGTCTA TTCATTCAAG ATGGCAGTAT CAAAGAAATT 
ACGTCAGTAG TTCCTGAAGA TGCAAAAGAT GTAATTGATG CAAAAGGGTA TTTGGCATTA 
CCGACCCTTA TGGATAATCA TATTCACTTG GATAAAGGTC ATTACGGTGG CAAATGGCAT 
GCTGTAGTAC CAATGCATAG TGTTGCAGAA AGAATTGAAG AAGAGAGAGG ATTTTTACGT 
GATGCTCTTG CAGATACACC GCAAAAAGCA CAAGCCTTAA TAGACTTGAT TACAGGTAGG 
GGTGCAACGT TTTTACGTGT ACAAACGAAC GTAGACCCTG TAATTGGGTT AGATAATGTT 
ACTGCTATCA AAGAAGTTCT TGAACAAAAC AAACATAAAT TAAAGTATGA AATCGTAGTA 
TTTCCACAGC ATGGAACAGT AGTTACAGAA GAACTAGGTT TATTAAGCAA ATCATTAGAA 
GATGAGGCTG TTACAACTAT AGGTAGTGTA GATCCAGCAA CAATTGATGG AGACATTGAA 
AAATCATTAA AGATTACGTT TGATTTAGCA ACCAAATATC AGAAGGAAAT TGATATCCAT 
TTACATGATA GAGGTACTTT AGGTATTTTT GAAATCAATC GTATCATTGA CTATACGATT 
GCTACGAATA TGCAGGGAAA AGTACAAATA AGTCACGCAT TTTCGCTTGC AGATGTATCG 
AATGATGTAG TAATAGCTAC TTTAAAACGT TTAAAAGAGG CTAATATAGC AATTAATACA 
ACCGTTCCGA TTGGGATGAA GGCTTTATCC ATTCCATTGC TAGAAAGTTA CGGTGTTAAG 
GTAAATATAG TTAATGATAA TATTAATGAC CACTGGAGCC CATTTGGATC GGGAGACTTA 
ATCGAAAGAG CAAGTCGCGC GGCGGAATGT TTTTCTATGA CTGATGAAGT TTCCTTATCA 
CAGGCTTTAG GACTTGTTAC AAATGGCATA ACCCCTCTTG ATCTAGAAGG AAATATGGTT 
TGGCCTAAGG TCGGAGATAA AGGAAATATT CTTTTTGTAA AGGCAGAGAC TTCTGCCCAC 
TTAATAGGAA GAGTTTGCCC TGAAAGAGTT GTTTTATTTG AAGGAGAATG TGTATCCGGA 
GAATTTAAAT AG

Protein sequence

MGWIKNVLLE IGREEIVKDT METKTEQVCL FIQDGSIKEI TSVVPEDAKD VIDAKGYLAL 
PTLMDNHIHL DKGHYGGKWH AVVPMHSVAE RIEEERGFLR DALADTPQKA QALIDLITGR 
GATFLRVQTN VDPVIGLDNV TAIKEVLEQN KHKLKYEIVV FPQHGTVVTE ELGLLSKSLE 
DEAVTTIGSV DPATIDGDIE KSLKITFDLA TKYQKEIDIH LHDRGTLGIF EINRIIDYTI 
ATNMQGKVQI SHAFSLADVS NDVVIATLKR LKEANIAINT TVPIGMKALS IPLLESYGVK 
VNIVNDNIND HWSPFGSGDL IERASRAAEC FSMTDEVSLS QALGLVTNGI TPLDLEGNMV 
WPKVGDKGNI LFVKAETSAH LIGRVCPERV VLFEGECVSG EFK