Gene Cphy_0894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_0894
Symbol
ID	5741766
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	1144874
End bp	1145986
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	35%
IMG OID	641292006
Product	extracellular solute-binding protein
Protein accession	YP_001558018
Protein GI	160879050
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT CTAAACTTTT TGTAGCGCTC CTTCTTGTAA GCTCACTGGT ATTCTCCGGT 
TGTGGCTCCA AGGAAGACAA AGGTAATAAT ACTACTCCGG GAAATGGAGG GGAAAATCCA 
GGAAACAGCA GTTCTTCCAA TAAAGGCGAA GTCTATGTTT ACAACTGGGG TGAATATATT 
GACCCTGATG TTAAAAAAAT GTTTGAAGAC GAGACTGGTA TTAAATTAAT CTATCAGGAA 
TTCGAATTAA ACGAGGACAT GTATCCTATC ATTAAAACCG GTGCAGTAAA TTATGATGTT 
GTTTGCCCTT CTGATTATAT GATCGAGAAA ATGATTCAGG AAAACTTACT TGCTGAAATT 
AATTTTGATA ATATTCCAAA CATTACAAAC ATCGATGAAA TGTATTTAAA AACAGCGGAA 
AGTTTTGATC CAGGCAATAA ATACAGTGTT CCTTATTGTT GGGGTACGGT TGGTATTCTT 
TATAACAAAA CTATGGTAGA CGGACCAGTT GATAGTTGGA GCGTATTATT TGATGAAAAG 
TACAAAAATG ATATCTTAAT GATTGATAGC GTTCGTGATG CTTTCATGGT AGCATTAACC 
TATCTTGGTT ACGACCAAAA CACAACAGAT GAGAAAGAAT TAGATGCTGC TAGAGATTTA 
TTAAAAAAAC AGTATCCATT AGTTCAAGCA TACGTTGTTG ACCAGGTTCG TGACAAGATG 
ATTGGTGAAG AGGCCGCTCT TGGTGTTATC TACTCTGGTG AAGCAATTTA CACAAAACGT 
GAGAATGAAA ATCTTGAATA TGTGGTGCCA AAGGAAGGCT CTAACGTTTG GATTGATGGT 
TGGGTAATTC CTAAGAATAG TAAGAATAAA GAAAATGCAG AAGCATGGAT TAACTTTATG 
TGCCGTCCTG ACATTGCATT AAAGAACTTT GAATATATTA CTTATTCTAC ACCAAACAAA 
GCAGCCAGAG AATTAATTGA AGACGAAGAC ATTAAGAACA GCCAAGTTGC TTTCCCTGAT 
GCGTCTATAC TTGATCGCTG TAAGTCTTTC AAATATCTTG GCGAAGATAT GGAAAATATC 
TATGTGAAAA AGTGGAATGA TGTAAAATAT TAA

Protein sequence

MKKSKLFVAL LLVSSLVFSG CGSKEDKGNN TTPGNGGENP GNSSSSNKGE VYVYNWGEYI 
DPDVKKMFED ETGIKLIYQE FELNEDMYPI IKTGAVNYDV VCPSDYMIEK MIQENLLAEI 
NFDNIPNITN IDEMYLKTAE SFDPGNKYSV PYCWGTVGIL YNKTMVDGPV DSWSVLFDEK 
YKNDILMIDS VRDAFMVALT YLGYDQNTTD EKELDAARDL LKKQYPLVQA YVVDQVRDKM 
IGEEAALGVI YSGEAIYTKR ENENLEYVVP KEGSNVWIDG WVIPKNSKNK ENAEAWINFM 
CRPDIALKNF EYITYSTPNK AARELIEDED IKNSQVAFPD ASILDRCKSF KYLGEDMENI 
YVKKWNDVKY