Gene Cphy_2907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2907
Symbol
ID	5743967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3565952
End bp	3567148
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	38%
IMG OID	641294007
Product	cysteine desulfurase NifS
Protein accession	YP_001560004
Protein GI	160881036
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000201074
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAAAA TGATTTATTT AGATAATGCT GCTACCACTC AGACCAGACC GGAAGTAGTA 
GAGGCCATGT TACCATATTT TTATGAGAAT TATGGGAATC CTTCCAGCGT ATATGAAATC 
GCGACGAGAA GTAGAAAAGC AGTAACAGAA GCAAGAGATA TCATTGCTAA GACCATAGGC 
TGTGAGAATA ATGAGATTTA TTTTACCGCT GGTGGATCTG AGTCTGACAA CTGGGCGATT 
AAAGGTGTTG CAGAAGCTTA TCGTGACAAG GGTAATCATA TTATTACATC TAAGATCGAA 
CACCATGCGG TTTTGCATAC TTGTGAGTAC TTAGAGAAAC TTGGGTTTGA AGTTACTTAT 
CTCGATGTGG ATGAAAGCGG AATTGTAAAG CTTGATCAAT TAAAAGCTGC GATTCGTCCA 
ACCACTATCT TAATATCAAT TATGTATGCA AATAATGAAA TCGGTGCGAT TCAGCCTGTA 
AAAGAAATTG GTGATATTGC GAAGCAGCAC AATATTTTAT TCCATACGGA TGCAGTTCAG 
GCTTTTGGAC AGTTGCCAAT CGATGTGAAA GAACTTGGTA TTGATATGTT AAGTGCCAGT 
GGTCATAAAT TAAATGGACC AAAGGGAATT GGTTTCCTCT ATATTAGAAA TGGCCTTAAG 
GTACGTTCTT TTGTTCACGG CGGCGCTCAG GAAAGAAAGC GTAGAGCAGG TACTGAAAAT 
GTACCAGGTA TTGTTGGATT TGGTAAGGCA GTTGAGCTTG CAGCATCCAA TTTAAAGGAA 
AGAACCAAGA AGGAAATAGA ACTTCGAGAC TATCTTATTG AGCGAGTATT AAAAGAAGTT 
CCTTACACTA GATTAAATGG ACATAGTAAG AATCGTTTAC CAAATAACGC AAACTTAAGC 
TTCCAATTCA TCGAGGGAGA ATCTCTATTA ATCATGCTCG ATATGCAAGG AATTGCAGCA 
TCCAGTGGTT CAGCTTGTAC TTCTGGATCA TTAGATCCTT CTCACGTTTT ATTGGCAATT 
GGATTACCAC ATGAAATTGC ACATGGCTCA TTAAGATTAA CTCTAAGTGA GGACACAACA 
AAAGAAGATA TCGATTTCAC AATCGATCAG ATAAAAGAGA TTGTAGATAA ATTAAGACAG 
ATGTCACCAC TGTACGAAGA CTTTATGAAA AAGTTAGCAA AGAATCGTGC AGAATAA

Protein sequence

MGKMIYLDNA ATTQTRPEVV EAMLPYFYEN YGNPSSVYEI ATRSRKAVTE ARDIIAKTIG 
CENNEIYFTA GGSESDNWAI KGVAEAYRDK GNHIITSKIE HHAVLHTCEY LEKLGFEVTY 
LDVDESGIVK LDQLKAAIRP TTILISIMYA NNEIGAIQPV KEIGDIAKQH NILFHTDAVQ 
AFGQLPIDVK ELGIDMLSAS GHKLNGPKGI GFLYIRNGLK VRSFVHGGAQ ERKRRAGTEN 
VPGIVGFGKA VELAASNLKE RTKKEIELRD YLIERVLKEV PYTRLNGHSK NRLPNNANLS 
FQFIEGESLL IMLDMQGIAA SSGSACTSGS LDPSHVLLAI GLPHEIAHGS LRLTLSEDTT 
KEDIDFTIDQ IKEIVDKLRQ MSPLYEDFMK KLAKNRAE