Gene Cphy_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2003
Symbol
ID	5743031
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	2471732
End bp	2472706
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	35%
IMG OID	641293100
Product	NLP/P60 protein
Protein accession	YP_001559110
Protein GI	160880142
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000114468
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAA CAAAGCAACT ACTGTTAAAA CGTTTGATCG TAATGTTTGG TCTTATATTT 
TCACTTGTTT GTCTTAGTCC TAAAATAGTA ACTTGGGCAG CAAGTAATTC AGAACCAAAC 
GTTGGAGTAA GTACCACAAA AGAGACACCA CTGAATATCC GTGCATCTGC CAGTACTTCC 
TCTGCAAATG TTTCTTCCTT AAATCCCAAT ACTCCAATTC AAGTAATCGG AAGTTCTGGT 
GACTTCTATA AAGTAATCTA TAGTACCAGT GGAAATGTTG GCTATGCACA CAAATCATAT 
ATCAACATAT CATCCACCAA ATATGGAACT GTTGTTACCA ATGGAGGAAC CTTAAACTTA 
CGTTCATCCG CTTCCACTTC TTCTCAGATA CTCGGTAATA TCCCAAGCCA AACTGTTTTA 
CCAATTATCA GTGCAGAGGA TGGATGGTAC AAGGTTGTAT GGGGTAAATC GGTTGGATAT 
GTAAGTAGCA CCTATTTTAA ATCTGGTACT TCTTCAGAAA ATTCAGAAAC AAGTAACTCT 
TCTTCAACAT CCCCTACCAG AAATGAGATT GTAGAATATG CAAAAACATT TCTAGGTATA 
TACTATCAAT GGGGAGGAAA TTATCCGCAA GGAAGTAGTT ACGGTTTAGA CTGTTCTCAT 
TATACTTATC AAGTATTTAA GAAGTTTGGT TTAATGAATT CCTATATGGT TTCTGCTGAC 
CAAGCTAATT ATGTAAAGAA AATTACACGA AGTGAATTAA AACCAGGAGA TTTAGTATTT 
TTTAAATCCA AATCCAGTGG TAATGTAGTA CATGTTGCAA TCTATATTGG AGATGGACAA 
ATCATAGGTG CTAATGGTGG AGATTCTAGC GTAAATTCAA TAGAAACCGC AAAGAAAAAG 
AATGCAATGG TAAAGATTCA ATCCGTTGAT TATGATTCAA GAGAAAAAAT ATACGGTCGT 
ATTCCAGGAC TATAA

Protein sequence

MLKTKQLLLK RLIVMFGLIF SLVCLSPKIV TWAASNSEPN VGVSTTKETP LNIRASASTS 
SANVSSLNPN TPIQVIGSSG DFYKVIYSTS GNVGYAHKSY INISSTKYGT VVTNGGTLNL 
RSSASTSSQI LGNIPSQTVL PIISAEDGWY KVVWGKSVGY VSSTYFKSGT SSENSETSNS 
SSTSPTRNEI VEYAKTFLGI YYQWGGNYPQ GSSYGLDCSH YTYQVFKKFG LMNSYMVSAD 
QANYVKKITR SELKPGDLVF FKSKSSGNVV HVAIYIGDGQ IIGANGGDSS VNSIETAKKK 
NAMVKIQSVD YDSREKIYGR IPGL