Gene Cphy_3402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3402
Symbol
ID	5743679
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4163470
End bp	4164825
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	36%
IMG OID	641294508
Product	extracellular solute-binding protein
Protein accession	YP_001560494
Protein GI	160881526
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000236647
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTA AAAAAATCAT GACAACATTG TTGGCAGCAA GTTTAGTGTT GGGACTAACA 
GCTTGTGGTT CTGGAAAAAA GAATACTACA GTAGATAATG ATACTAGTGG TGCAAAGAAT 
ACAGAACAAT CATCAGGTAC AAAAAAAGAT GAATCGAACG GAGAAAAGAT TAAACTTCGT 
ATGGCATGGT GGGGTTCACA AACTAGACAT GATGCTACAG TAAAAGTAAT TGAGCTGTAT 
GAGTCACAGA ATCCTAACAT CGATATTGAG TACGAATTCT TTGATTTTGA TGGTTACTTC 
ACAAAGTTAA ATACTTTAGT AGCATCGAAC ACTGTGTGGG ATATCTTCCA ATTAGGAGGT 
AATTTCCCAA CATATTTAGA CAAAATCGTT CCACTTGATG AATACATAGC AAACGGTACT 
GTAGATACGT CTCATACGAC GGATGCTTAC TTATTAACAA CTCAATACAA AGGATCTCAG 
TTGGCATTAT CCAGTGGTGT TAACTCCTAT GGTATTGCAT ATGATCCAGC ATTATTTGCA 
CAGGCTGGTG TAGCAGAACC AAACGATAAC TGGACATGGG ATGAATGGAA GCAAGCTTGT 
TTGACTATTC ATGAGAAGTT AGGAATTTAC GGAAGCTCTA AGCTGGATGA TTTTATATCT 
GGTTGTAGTA TGGGAATCTC TCAAGAGGAT TATTCTTTAA ACTTCTTTGC TCCATCCAAT 
GATAAGCTTG GATTTGATGA TCCGAATATG TTAGTGGATT ATTTAGCAAT GAGAAAAGAA 
TTAGTAAAAG CAGGAGCATA TCCTGATCCA GGTGCAATTG CTGAAATTAA AGACATCGAA 
GGTGATTATT TAGTTACTGG TGAAGCTGCT ATGACATGGG TAGCTAGTAA TCAGTTAAAA 
TCCTTAATTA AAGCAGCAGA TAGAGAATTA AAAATTGCTC CTGCTCCAAG AAAGTTTGCA 
GATGGACCAT CAGGATCTGT AATTCAATCC TCACAAATGC TTTGTATATC AAAAGATTCT 
AAGGTTCCTG AAGAAGCAGC AAAATTCATT AACTTCTTTA TCAACAGTGT GGAAGCAAAT 
GAAATTCTTC AAGGTGAACG TGGTATTCCA ATTATGGATA CTGTTCGTAT GGCTTTACAG 
TTAAATGCAG ATGAGACTAC AAATACTATG TACAACTTTA TTGATTTAAT TGGTAGCTAC 
AAAACTGGAG AAGAAGTTAA CGTTATAAGC CCAGAGTGTA AGACAATTAT TGAAGATCAA 
TATAAATTGT TAGTAGAACA AGTTATTTAT GGAGATAAGA CACCTGAGGA AGCGGCAAAA 
GAAATTTTTG ACTTTGCGAG CAGACAATTT AAATAA

Protein sequence

MKLKKIMTTL LAASLVLGLT ACGSGKKNTT VDNDTSGAKN TEQSSGTKKD ESNGEKIKLR 
MAWWGSQTRH DATVKVIELY ESQNPNIDIE YEFFDFDGYF TKLNTLVASN TVWDIFQLGG 
NFPTYLDKIV PLDEYIANGT VDTSHTTDAY LLTTQYKGSQ LALSSGVNSY GIAYDPALFA 
QAGVAEPNDN WTWDEWKQAC LTIHEKLGIY GSSKLDDFIS GCSMGISQED YSLNFFAPSN 
DKLGFDDPNM LVDYLAMRKE LVKAGAYPDP GAIAEIKDIE GDYLVTGEAA MTWVASNQLK 
SLIKAADREL KIAPAPRKFA DGPSGSVIQS SQMLCISKDS KVPEEAAKFI NFFINSVEAN 
EILQGERGIP IMDTVRMALQ LNADETTNTM YNFIDLIGSY KTGEEVNVIS PECKTIIEDQ 
YKLLVEQVIY GDKTPEEAAK EIFDFASRQF K