Gene Cphy_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3843
Symbol
ID	5744795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4707224
End bp	4708408
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	42%
IMG OID	641294955
Product	tryptophan synthase subunit beta
Protein accession	YP_001560929
Protein GI	160881961
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAG GAAGATTTCA TCAATATGGC GGTCAATATG TACCAGAAAC ATTAATGAAT 
GCGGTGTTAG AGGTAGAAAA GGCATACGAG TATTTTAAAA AGGATCCTGA TTTTTGTAAG 
GAACTAGAGA CCTTATACCA TGAATATGCA GGAAGGCCAT CGTTGTTATA TTACGCTAAG 
AAAATGACCG AGGATCTTTC TGGGGCTAAA ATTTACTTAA AGCGAGAGGA TTTAAATCAT 
ACGGGTTCTC ACAAAATTAA TAATGTACTA GGTCAGGTAT TATTGGCAAA AAAAATGGGT 
AAGACACGTG TCATAGCAGA AACTGGAGCC GGCCAACATG GTGTGGCGAC AGCAACAGCC 
GCAGCACTTA TGGGACTGGA ATGTGAAATC TTTATGGGAA AAGAGGACAC AGACCGACAG 
GTACTGAATG TCTATCGAAT GGAACTATTG GGAGCTAAGG TGCATCCAGT AACCTCAGGA 
ACTATGACTC TTAAGGATGC AGTAAACGAA ACGATGCGTG AGTGGACGAA GAGGGTAGAG 
GATACTCATT ATGTTTTAGG GTCTGTTATG GGACCTCATC CTTTCCCAAC AATTGTTCGA 
GATTTTCAGA AAGTGATTGG TAAGGAAATC AAAGCTCAAC TACAGGAAGT GGAAGGAAAA 
CTTCCAGATG CAATCGTTGC CTGTGTTGGT GGAGGGAGTA ATGCTATGGG AGCATTTTAT 
GAATTCCTAA ATGATCCTAG TGTAGCTTTA TATGGTTGTG AGGCAGCAGG ACTTGGTGTA 
AATCATCCTA AAAATGCAGC TACCATCGCA AATGGAACAG AAGGTATTTT CCATGGAATG 
AAATCTTATT TCTGCCAGGA TGAATATGGT CAAATTGCTC CTGTTTACTC TATTTCTGCG 
GGTCTTGATT ACCCTGGAAT CGGACCGGAG CATGCTATGT TACATGATAC CAATCGGGCA 
ACTTATGTAC CAGTTACGGA CGATGAAGCG GTGGAGGCAT TTGAATATCT TTCAAGAACA 
GAAGGAATTA TACCTGCAAT AGAGAGTGCT CATGCTGTTG CATACGCAAA GAAGTTAGCG 
CCAACGATGG GGAAAGACAG TATCCTTGTG ATAAATATCT CAGGACGTGG AGATAAGGAT 
GTTGCTGCGA TTGCTAGATA TAGGGGGGTG AAATTATATG ACTAG

Protein sequence

MKEGRFHQYG GQYVPETLMN AVLEVEKAYE YFKKDPDFCK ELETLYHEYA GRPSLLYYAK 
KMTEDLSGAK IYLKREDLNH TGSHKINNVL GQVLLAKKMG KTRVIAETGA GQHGVATATA 
AALMGLECEI FMGKEDTDRQ VLNVYRMELL GAKVHPVTSG TMTLKDAVNE TMREWTKRVE 
DTHYVLGSVM GPHPFPTIVR DFQKVIGKEI KAQLQEVEGK LPDAIVACVG GGSNAMGAFY 
EFLNDPSVAL YGCEAAGLGV NHPKNAATIA NGTEGIFHGM KSYFCQDEYG QIAPVYSISA 
GLDYPGIGPE HAMLHDTNRA TYVPVTDDEA VEAFEYLSRT EGIIPAIESA HAVAYAKKLA 
PTMGKDSILV INISGRGDKD VAAIARYRGV KLYD