Gene Cphy_2012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2012
Symbol
ID	5743040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	+
Start bp	2484588
End bp	2485658
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	37%
IMG OID	641293109
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001559119
Protein GI	160880151
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGCAA AAAAAGTTAT CGCGATTTCC TTGACGGCAG TTATGATGTT AGGTCTACTG 
TCTGGGTGTA AGAAGGAGGA TTCTAATGAC AAAGCTACAA GCGGTTCCGG TAAAGAAATG 
ACGGTTGAAA TTGTAGCAAA AGGTTTCCAA CATGACTTTT GGCAAGCAGT ATTAGCAGGA 
AGTAAGAAAG CAGAAAAAGA ATTCAATGTT AAAACAAATT TCGTGGGTCC AGAGGGTGAA 
GGTGCAATTG CAACGCAAGT AGAACAGATT AACAATGCAA TTAATAAAAA ACCTTCTGCA 
ATATGTCTTG CAGCTCTTGA TACAAATGCA GCTTTAGATG CACTTAGTCA AGCTAAGTCA 
CAAGGTATTC CAATCATTGG TTTTGACTCT GGTGTACCAG GTGCACCAGA AGGTTCTGTA 
AAGGCAAATG CAGCAACAGA TAATTATGCA GCTGGTGAAT TAGCAGCTAC AAAAATGTAC 
GAAGCAATTA AAGATAAGGT AACTAATCCA TCCAATGTTG TTCGTATTGG TGTAGTGTCC 
CAAGAAGCTA ACTCTGATTC CATCATCAAA CGTACATCAG GTTTTGTTGA CAAGATGAGT 
TCTTTAATTG GTGAAAATAA CTCCTGCGTA GAAGGTCATG ATAAGTATAA TCGTAAATCA 
GATGGTGCGA AAGTTATCAT TGAAGTGCGT ATTCCAGCAG AAGTTACTGA TAACGCAGGT 
AAGACAGAAG CATTAACATT ATTAAACAAA GAAGACTTAG TTGCTATTTA TGGATCTAAT 
GAATTTGCAG CAAAATGTAT TATTAACGCA AATGAAGGTT TAAATAAGCT TGGTGAAGGT 
AAAGTTATCG CAGTTGGTTT TGACTCTGGT GCACTTCAGA TTGATGCTAT TAAGAATAAG 
GTATTCTATG GTTCTGTTAC ACAAGATCCA GTTTCCATTG GATATAATGC AGTACGTTTA 
GCTGTTGCAG CAGCAAAGGG TCAGAAAGTA GAAGATGTGG ATACTGGTTG TCAGTGGTAT 
AATTCAGAAA ATTATAATTC AGCCGATATT GCACCTTGTT TATATCAGTA A

Protein sequence

MRAKKVIAIS LTAVMMLGLL SGCKKEDSND KATSGSGKEM TVEIVAKGFQ HDFWQAVLAG 
SKKAEKEFNV KTNFVGPEGE GAIATQVEQI NNAINKKPSA ICLAALDTNA ALDALSQAKS 
QGIPIIGFDS GVPGAPEGSV KANAATDNYA AGELAATKMY EAIKDKVTNP SNVVRIGVVS 
QEANSDSIIK RTSGFVDKMS SLIGENNSCV EGHDKYNRKS DGAKVIIEVR IPAEVTDNAG 
KTEALTLLNK EDLVAIYGSN EFAAKCIINA NEGLNKLGEG KVIAVGFDSG ALQIDAIKNK 
VFYGSVTQDP VSIGYNAVRL AVAAAKGQKV EDVDTGCQWY NSENYNSADI APCLYQ