Gene Cphy_2075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2075
Symbol
ID	5744081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2559369
End bp	2560538
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	38%
IMG OID	641293172
Product	amidohydrolase
Protein accession	YP_001559182
Protein GI	160880214
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.526521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAT TACTAATTAA AAATGGAACC ATTTACAATA GTACTGAAAT TATGCCTTTT 
CAGGCTGATA TCCTAGTCGA GAATGGTAAG ATATTAAAAA TAGAAGAGCA GATTACTGAA 
ACGAAGGAAA TGAAAGTCAT TGATGCATTA GGTCTTTTTG TGTACCCGGG TTTAGTTGAA 
GCACATTCCC ACATCGGTCT TGATGGTTAT GGTATAGGAT TTGAAGGCCA AGATTACAAC 
GAGATGAATG ACATTTTAAC TCCGCATTTA AATGCGATCG ATGGTATTAA TCCTATGGAT 
GTTACTCTTA AGAAAGCAGC CCTTGGTGGA GTGACCTGTG CTGCAACGGG ACCAGGAAGT 
TCTAATGTAC TTGGTGGAAC ATTTACTGCG ATTAAGATGA CTGGCAATCG TGTAGATCGC 
ATGGTAGTAA AAGAAAAGGT TGCTATGAAG TGTGCTTTTG GAGAAAATCC AAAGAGAGTC 
TATAAAGATA AGAACAACTA TTCTAGAATG TCCACAGCCT CTAAACTTAG AGAAATGCTA 
AATAAAGCGA AGGAATATCA AGCAAAGCTA GTTGCAGCTG GAGAAGATAT CTTTAAAAAG 
CCTAGCTATG ATGCGAAACT AGAAGCTCTT TTACCAGTTT TAAATCGTGA CATCCCTTTA 
AAAGCACATG CTCATCGTTC TGACGACATC TTTACAGCAA TCCGAATTGC AAAAGAGTTC 
GATTTAAGAT TGACAATCGA ACATTGTACA GAAGGCCATC TTATATCAGA AGAATTACAA 
AAAGATGGTT ATCCAGTAGC AGTTGGACCT TCCTTTGGTC ATGCAACCAA ATATGAGCTC 
CGCAATAAGA CATTCGAAAC TCCTGGTATC TTAGCGAAGG CTGGTTTGCA GGTATCCATT 
ATTACAGATA GTCCTGTTAT TCCTCAACAT TACTTGTCGT TATGTGCTGG TTTAGCTGTA 
AAATCAGGAA TGGAGCCATT TGCAGCACTA CAAGCAATAA CCATTAATCC TGCAAAACAT 
ATCGGTATTG AAGACCGTGT CGGCTCTCTT GAAGTAGGTA AGGATGCTGA TATTGTCATC 
ACAGATGGTG ATATCATGGA TTCCATGACT TCAGTTCTAT ACACATTTAT CGATGGTAAT 
GAGATTGATA GAACAGAGAA TTACTTATAA

Protein sequence

MSQLLIKNGT IYNSTEIMPF QADILVENGK ILKIEEQITE TKEMKVIDAL GLFVYPGLVE 
AHSHIGLDGY GIGFEGQDYN EMNDILTPHL NAIDGINPMD VTLKKAALGG VTCAATGPGS 
SNVLGGTFTA IKMTGNRVDR MVVKEKVAMK CAFGENPKRV YKDKNNYSRM STASKLREML 
NKAKEYQAKL VAAGEDIFKK PSYDAKLEAL LPVLNRDIPL KAHAHRSDDI FTAIRIAKEF 
DLRLTIEHCT EGHLISEELQ KDGYPVAVGP SFGHATKYEL RNKTFETPGI LAKAGLQVSI 
ITDSPVIPQH YLSLCAGLAV KSGMEPFAAL QAITINPAKH IGIEDRVGSL EVGKDADIVI 
TDGDIMDSMT SVLYTFIDGN EIDRTENYL