Gene Cphy_3700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3700
Symbol
ID	5742724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4549489
End bp	4550538
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	37%
IMG OID	641294810
Product	LacI family transcription regulator
Protein accession	YP_001560786
Protein GI	160881818
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000696494
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAGG AAAAAATATC AGTACAGGAG AATAAGAAGA TGGCTACGAT TCGAGACATT 
TCGTTAAAAT GTGGGGTATC GGTTTCTACA GTAAGTAAGG TATTAAATGG ATACCGAGAA 
ATTGGGGAAG AGACTTCGAA AGCGGTTATG AAAGCAGCAG AGGAGCTTGG GTATGTACCA 
AACTCTTATG CCAGACAACT GAAACTTAAA AAATCGTATA ATATAGGTGT ATTATTTGAT 
ACCTTATCTG TTTATGGTTT AAAGAATGAA TACTTTGCAC ACATTTTAGC CGCATTGAGA 
GAGAATGCGA GCCAAGGGGG CTATGATATC ACCTTTATTG AGAATAATAT AGGGAATCGT 
AGAATGACCT ATCTTGAACA CTGTAAATAT CGAAATTTCG ATGGAATTTG TATTGTATGC 
GCTGATTTTA CTAATCCTGA GGTATTAGAT GTAGTCAATA GCGATTTTCC AGTGGTAACA 
ATTGATCATT CATTTAACGA AGCAATTAGT ATCTTATCAG ATAATTCTGG TGGTATGAGA 
GATTTGGCCC AGTATATTGT TTCGATGGGA CATAAGAAAA TAGCTTATAT TCATGGTAAT 
AAGAGTTCTG TAACTCATAA TCGTTTGGTC GCATTTCACC AAGTATTAGC GGAACATGAT 
ATTGTGATAC CGGAGTATTA CATGAAGGAA GGCGAATATC GCCTTGCTGA GTCAGCAGAG 
GAATTTACGT ATGAATTACT AAATCTTTCG GATAGACCAA CTTGTATCTT AGCTTCTGAT 
GACTATGCTG CACTAGGCGT GATAAAAGCA ATTAAGCGAG CTGGGCTAAG GTTTCCAGAG 
GATATATCGG TAGCAGGGTT TGATGGAATA TCCATCTCTC AAGCGCTTGA GCCTAAGCTA 
ACTACAGTAA AGCAGGATAC TGAAAAATTA GGGGAACAGG CAGCAAAAAA ATTAATTTGT 
TTAATGGAAA GTCCTATGAC TACCCCTTTG GAGCATATTG TATTAAAGGC AGAATTAATC 
ATTGGTGATT CTGTTAAAAA ACTTAGATAA

Protein sequence

MSKEKISVQE NKKMATIRDI SLKCGVSVST VSKVLNGYRE IGEETSKAVM KAAEELGYVP 
NSYARQLKLK KSYNIGVLFD TLSVYGLKNE YFAHILAALR ENASQGGYDI TFIENNIGNR 
RMTYLEHCKY RNFDGICIVC ADFTNPEVLD VVNSDFPVVT IDHSFNEAIS ILSDNSGGMR 
DLAQYIVSMG HKKIAYIHGN KSSVTHNRLV AFHQVLAEHD IVIPEYYMKE GEYRLAESAE 
EFTYELLNLS DRPTCILASD DYAALGVIKA IKRAGLRFPE DISVAGFDGI SISQALEPKL 
TTVKQDTEKL GEQAAKKLIC LMESPMTTPL EHIVLKAELI IGDSVKKLR