Gene Cphy_2466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2466
Symbol
ID	5742537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3027334
End bp	3028755
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	38%
IMG OID	641293556
Product	extracellular solute-binding protein
Protein accession	YP_001559566
Protein GI	160880598
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000586108
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA TGAAAAAAGC ATTAGCTATG CTCATGGTTT TGACCATGGT TTGTGCTATG 
TTTGCAGCAT GCGGTAAGAA CGACCAAAAA GCAAACAAGG ACCAAACAAA CAAAGAGAAT 
ACAAAAGATA ATTCAACTGA TGGTAAGAGT GGTGACAACA AAGAGAAGAC AACAGCTGGG 
TCTACTGGCG GTAAGACATT AAGAATATAT TGTTGGAATA CTGAGTTCCA GGATAGATTC 
AACGAGTATT ATGCTAGTAA AATTCCATCT GGCGTAACGG TCGATTGGGT TATCAATCCT 
AATGAAGACA ATGTATACCA GACAAAGCTC GATGAAGCAT TACAAAAACA GGCCTCTGCT 
TCACCGGAAG ATAGAATTGA CTTATTCCTG ATAGAAGCTG ACTATGCATT AAAGTATGTT 
GGTACTGACT ATACTTTGGA TGTTGTGAAG GATATTGGCC TAACAGAAGA CGATCTTTCT 
CAACAATATC AATACACAAA GGATGTTGTT ACGGTTGATG GCTCTCTTAA AGGTGTTTCA 
TGGCAGTCTT GTCCAATGGG CTTTCTTTAT AGAAGATCCA TGGCTAAAGC AGTGTTAGGA 
ACAGACGATC CTGATCAGGT TCAAGAGATG ATTTCAGACT GGACAAAATT TGATGCTGTA 
GCTGCGAAGA TGAAAGATGC AGGTAACTTC ATGCTATCTG GCTATGATGA TGATTATCGT 
GTATTTGCTA ACAACAAGAA ATTGCCTTGG ATTGATGATA ACAATAAGAT CGTAGTTGAT 
GATGAGATCA AACAATGGGT ATCGCAGACT AAGACATATA CAGATAAAGG TTACAATAAC 
AAAGCTAGCT TATGGTCAGC AGAGTCAACT GCTCAGATGG CAAAAGACGG TAAGGTATTT 
GGCTACTTTG GACCGGCTTG GTTTATGGAT TTCTGCTTCA TGGATTACAC ACTTGATGAT 
CCAAATCAGC CAAAAGAAAT TGGTAACGGT GGTTACGGTG ACTGGGCTAT GTGTAAAGGG 
CCTCAGGGAT CTTACTGGGG TGGTACATGG ATTTGTGGTG CAGCAGGAAC AGATAATATC 
GATATCGTAA AAGATATTAT GTTAACTATG ACATGCAATA AAGATACACT TGTTAAGATT 
ACTAACAAAT TTGGTGATTT TACTAACAAT GTAGCAGCTA TGACAGAACT AGCTAACAGT 
GATTTTGGAT ATCCTTTCTT AGGAGGTCAG AATCATATCA AAGTATTACT TGAATCTGCA 
CAAGATATTC ATATTTCTGC AGCATCACCT TTTGATCAGA CTATGACTGA AAAACTTCAA 
TTAGCAATGA AAGACTACTT TGAAGGAGTT GTAACAGAAC AGCAGGCTTG GGATAACTTC 
TATACAGAAG TTTTAGGAAA GCATCCAGAA CTTAGTAAAT AA

Protein sequence

MKKMKKALAM LMVLTMVCAM FAACGKNDQK ANKDQTNKEN TKDNSTDGKS GDNKEKTTAG 
STGGKTLRIY CWNTEFQDRF NEYYASKIPS GVTVDWVINP NEDNVYQTKL DEALQKQASA 
SPEDRIDLFL IEADYALKYV GTDYTLDVVK DIGLTEDDLS QQYQYTKDVV TVDGSLKGVS 
WQSCPMGFLY RRSMAKAVLG TDDPDQVQEM ISDWTKFDAV AAKMKDAGNF MLSGYDDDYR 
VFANNKKLPW IDDNNKIVVD DEIKQWVSQT KTYTDKGYNN KASLWSAEST AQMAKDGKVF 
GYFGPAWFMD FCFMDYTLDD PNQPKEIGNG GYGDWAMCKG PQGSYWGGTW ICGAAGTDNI 
DIVKDIMLTM TCNKDTLVKI TNKFGDFTNN VAAMTELANS DFGYPFLGGQ NHIKVLLESA 
QDIHISAASP FDQTMTEKLQ LAMKDYFEGV VTEQQAWDNF YTEVLGKHPE LSK