Gene Cphy_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2007
Symbol
ID	5743035
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2477436
End bp	2479025
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	32%
IMG OID	641293104
Product	two component AraC family transcriptional regulator
Protein accession	YP_001559114
Protein GI	160880146
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCGGG TTTTACTTGT GGATGATGAA GATTTAGCAA GAGAGTCAAT TAGCCGTTGC 
ATCAAGTGGT CTGATTTAGG ACTATCATTG GTTGGAACAT GTAAAAACGG TAAGGAAGCC 
ATTCTGTTTG TCACGGAACA TGAAGTGGAT ATTGTTCTGA CTGATATCTG TATGCCATAT 
GTAGATGGGA TGGAATTAAG CAAATTCTTG TATGAGAATC ACAAAGACAT AAAGATTGTA 
ATATTTAGTG GTTATCATGA ATTTGATTAT GCAAAACAAG CAATGAAGTA TAAAGTAATC 
GAGTATTTAT TAAAGCCCGT TACAGCGCAG GAGCTAAGTG ATGTTTTGAT AAATCTTACC 
AATGAATTAA ATAAGAATCA GAAAGAACAA CAAGAAATAA CAATAATGAA ACAAGAATAC 
AATAAAAGTT TAACTTTGGT GAAAGGACAA GTATTATCCG ATTTGATGCT TGAAGGAAAC 
CCTAACGAAC AGTTAAAAAA TGATTTACAA CGATTACAAA TACATATCGA AGACTCTAAT 
TTACGTGTCG CATCTTTTAT GGTGACATCA TTTGATAGTG ATGAACCAAA ACAAAGTGCT 
TTAATATTAA TTACCATAGT AAAAATAATT GAAACAACGA TTAAAGATTA CGAAGACTGT 
ATCGTTTTTC AAGGAATGGA TAATGGTATA TACCTAATCT TTCACACGTC ACAAAAAAGA 
AATCTTGAGG ATAAAATTCA CTTAATTCTA AATGATATCA AAAAAAATAT TGAAGCAGCT 
ATGTCTTTTC ATATTCAGGT TGGAATGGGT AGATGGGTGC ATGGTATTCA AAACCTCTCA 
ATCTCATTTG AAGAAGCAAA ACGAGCTCTT TCCTATCGCT ATTTAGATCA CAATACTTAT 
CTTTGGGATA TAGATATGAT TAAAATGGTG GATAAGGTAG GCATTTATGA TCATCTTGAA 
GCTTTTCAGA CTGCGATAAG AGGTAACGAT AAAGAAGAAA TCAAAAAATT ACTGGGGCAA 
TTGCAAAAAG AATTTTACAT AGGTTATCTT GATAAAAACA GAATTTTGCT TTATTTACAA 
AGGATTATCT TGTTAACACG TAAGTTATTA GAAGAAGCAG ATATGGAGAA TAATAGTCAG 
ATACCAAAGG AGCACGACAT ATTAGAGCAA ATAAGTAAAG CACCTTACTT AGAGCAGGCA 
ATGAAACTGT TACAAAACTA TTTGAATGAA ATAGCGTGCC AGCTAAGTAT AGGGAAGGAA 
AGTAACAGCG AAAAATTAGT TGCACAAGCG AAGGCTTATT TGAACAAAAA TTTTAACAAC 
CCTGATTTAA GTTTATCTAT TCTTTGTCAA GAACTATTAA TCAGCCCATC GTATTTCAGC 
TCGATTTATA AAGCATCAAC CGGAGAGACT TTTTTAGAGA CCTTAAATCA AATACGCTTA 
GAGCAGGCAA AGCTATTGTT ACGAAATACA AACCTTAGGA ATTATGAAGT TGCGTTAAAG 
GTAGGATTTA GTGATCCTCA TTACTTTAAC ATCGCTTTTA AAAAAGCAAC GAAAATGACT 
CCAAAAGAGT TTGTTAAGAG AAATGATTGA

Protein sequence

MYRVLLVDDE DLARESISRC IKWSDLGLSL VGTCKNGKEA ILFVTEHEVD IVLTDICMPY 
VDGMELSKFL YENHKDIKIV IFSGYHEFDY AKQAMKYKVI EYLLKPVTAQ ELSDVLINLT 
NELNKNQKEQ QEITIMKQEY NKSLTLVKGQ VLSDLMLEGN PNEQLKNDLQ RLQIHIEDSN 
LRVASFMVTS FDSDEPKQSA LILITIVKII ETTIKDYEDC IVFQGMDNGI YLIFHTSQKR 
NLEDKIHLIL NDIKKNIEAA MSFHIQVGMG RWVHGIQNLS ISFEEAKRAL SYRYLDHNTY 
LWDIDMIKMV DKVGIYDHLE AFQTAIRGND KEEIKKLLGQ LQKEFYIGYL DKNRILLYLQ 
RIILLTRKLL EEADMENNSQ IPKEHDILEQ ISKAPYLEQA MKLLQNYLNE IACQLSIGKE 
SNSEKLVAQA KAYLNKNFNN PDLSLSILCQ ELLISPSYFS SIYKASTGET FLETLNQIRL 
EQAKLLLRNT NLRNYEVALK VGFSDPHYFN IAFKKATKMT PKEFVKRND