Gene Cphy_3027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3027
Symbol
ID	5743353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3697330
End bp	3698733
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	37%
IMG OID	641294128
Product	extracellular solute-binding protein
Protein accession	YP_001560123
Protein GI	160881155
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTAA AAAGCGCATT AAAACGTGGC TTTGCTTTCA GTTTAGCTAC AGTAATGGTT 
TTAAGTACAG CTGGATGTGG AAAATCCGAT AATACTAAGG ACAACTCGAA CGGTAATACA 
CCAACAGGTA CTGAAGGTAC CGAATCTTCT CAAAAGCCAA ACAGTGATAA GCCATATGAT 
GGTGTTACTG TTAAATGGGC GTTAACAGAT AACGCTGCAA CCGGTTCTGA AACAAAAGAG 
ATGGTTGACT TAATCAAAGA AAAAACAGGT ATTAACGTAG AGTTTTATAT CACTCCTACA 
TCAAAAGCAG GAGAAATGGA CAAGGTACTT GTAAGCTTAA TGGCAGGAGA AGCAATCGAC 
ATCATCGGTA GAACTCCACT TCAGTTAGAA GAATTCTACA AAGCTGCTGT ATTAGAGCCA 
ATTGATGACC TTGCAAAAGC AGATAACTAC GATATGTCAG CTATTTACGG TGACAAAATT 
GTAAAATTTG AAGATAAATC TTTCGCAATG CCTGCAGAAA AGGACATTTG GTTAACTTAT 
TATAATAAGA AAATCTTTGA TGACGCTAAT ATTCCATATC CAACAGCAGA AGGCTGGACA 
TGGGAAAAAT ATGTTGAGAC AGCTCAGAAA CTTAACAATC CAGAGAAAAA TATCTGGGGT 
TCCTTTATGA GTGATGACGT TGCTTGTAAC TATATGTTAG CTACACAAAA GGGTGTTTCT 
GCCTATAAAG CAGACGGAAC AGCAAACTTT GATGATCCTG CATTCGCTGA TGCTGCAAAA 
TGGTTCTTTA GTTTAGGAAA TGATCTTAAG ATTCAACCAG GTTGCATCGA TTTAGCTTCC 
GGAACATATC CATATAACTC TTTCATGGTA AATGGAAATA TCGGTATGTA TGTATATGGT 
GGATGGGTAG CAAGTGCATT ATCTGATAAG ACAAAATATC CAAGAGATTG GGAATTAGGA 
ATCCTTCCTA TGCCATATCC AGAAGGTGAA GATCCATCTT CTTTAACAAT TACAAGTTGC 
TATGCTATTC CAAAGACATC TAAGAATAAA GAAGCAGCAT TTGAAGCAAT TAAAACAATT 
TGTGAAAATA AATATACTTT AGGTTATGGA CGTGTTCCAG CAAAGATTCT TACAGAAGAT 
GAGGCAAAAA CATATATTGA GTCCAGCTTA CTTCCAAAAT TTAAAGATGA CAACTTAACA 
GTAGATGATT TCATGAAAGG TTGGTTTGAT AACAGCAGAT TATACTTAAG TGAAAAGATT 
ATGGGTACTG CTGATACAAC AATCGGTCAG ATTTACACTG AGGAAGGCCA GCTATACGGA 
CAGGGACAAA AGTCACTGGA AGATACCATG AAATCTATTC AGGACAGAGC AAATGAAGCG 
ATTAAAGAGG CTAATGAGCA ATAA

Protein sequence

MRLKSALKRG FAFSLATVMV LSTAGCGKSD NTKDNSNGNT PTGTEGTESS QKPNSDKPYD 
GVTVKWALTD NAATGSETKE MVDLIKEKTG INVEFYITPT SKAGEMDKVL VSLMAGEAID 
IIGRTPLQLE EFYKAAVLEP IDDLAKADNY DMSAIYGDKI VKFEDKSFAM PAEKDIWLTY 
YNKKIFDDAN IPYPTAEGWT WEKYVETAQK LNNPEKNIWG SFMSDDVACN YMLATQKGVS 
AYKADGTANF DDPAFADAAK WFFSLGNDLK IQPGCIDLAS GTYPYNSFMV NGNIGMYVYG 
GWVASALSDK TKYPRDWELG ILPMPYPEGE DPSSLTITSC YAIPKTSKNK EAAFEAIKTI 
CENKYTLGYG RVPAKILTED EAKTYIESSL LPKFKDDNLT VDDFMKGWFD NSRLYLSEKI 
MGTADTTIGQ IYTEEGQLYG QGQKSLEDTM KSIQDRANEA IKEANEQ