Gene Rcas_2159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2159
Symbol
ID	5539639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2774087
End bp	2775445
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	640894292
Product	tryptophan synthase subunit beta
Protein accession	YP_001432261
Protein GI	156742132
COG category	[R] General function prediction only
COG ID	[COG1350] Predicted alternative tryptophan synthase beta-subunit (paralog of TrpB)
TIGRFAM ID	[TIGR01415] pyridoxal-phosphate dependent TrpB-like enzyme

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000410823
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACCG TCAAGTATCT GCTCGCTGAG GATCAGATGC CGACCGCCTG GTATAATATT 
CAGGCAGATC TGCCCACACC GCCGCCACCG GTGCTCCATC CCGGCACAGG ACAGCCGATT 
GGTCCGCAGG ACCTGGCGCC GCTCTTTCCG ATGGCGCTGA TCATGCAGGA GGTGAGCACC 
GAGCGCTTCA TCGAAATTCC CGAAGAGGTG CAGACAATCT ATCGCCAGTG GCGCCCGACG 
CCGCTGTTCC GCGCGCGACG CCTCGAACAA GCGCTCGACA CGCCAGCCCG CATTTACTAC 
AAGTATGAGG GCGTCAGTCC CGCAGGAAGC CATAAGCCGA ATACCGCCGT CGCGCAGGCG 
TACTACAACC AACAGGAAGG GGTCAAACGC CTGGTGACCG AAACCGGCGC GGGGCAATGG 
GGTTCGTCGC TGGCAATGGC GGGCGCGTTC TTCGGGATTG AGGTGCTGGT CTTTATGGTC 
AAGGTCAGTT ACCAGCAGAA GCCGTACCGC CGCGCGCTGA TGGAAGCCTA CGGCGCGCGC 
GTGGTCGCCA GCCCCAGCGA AGAGACCAAC GCCGGGCGAG CGATCCTTGC CGAACATCCC 
GATAGCACCG GCAGCCTGGG AATCGCTATC TCCGAAGCGG TCGAGGTGGC AGCACAGGAC 
CCGGAGGCGA AGTATTCGCT CGGCAGCGTG CTCAACCACG TGCTGCTGCA CCAGACTGTT 
ATCGGCGAAG AGGCGCTGGC GCAGATGGAG ATGGCGGGTG ATTATCCCGA TATTATCGTT 
GGCTGCACTG GCGGCGGCAG CAACTTCAGC GGCATCTCGT TCCCGTTCAT CGGAAAGAAA 
CTGCGCGGCG AGCGCAATGT GCGTGTGGTG GCGGTCGAAC CGGCAGCCTG CCCGAGTATG 
ACGCGCGGTA AGTATGCCTA CGACTTTGGC GACACCGCCA AACTGACGCC GCTCGTCAAG 
ATGCACACTC TGGGACATGA TTTTGTGCCG CCGGGGATTC ATGCCGGTGG GCTGCGCTAC 
CACGGTATGG CGCCGCTGGT CAGTCATCTG CTCGAATTGG GAGTGATCGA GGCGATCAAC 
GTTCAACAAC TTGAGACGTT CGCGGCAGGC ATTCAGTTCG CTCGTGCAGA GGGGATCATC 
CCGGCGCCGG AAGCCAACCA CGCCGTTGCG GGTGCGATCC GTGAGGCGCT GCGCTGCAAG 
GAGGAAGGGG TCAGCCGCGC GATCTTGTTT AACCTCTGCG GACACGGGCA CTTCGATATG 
CAGGCGTATA CCGACTACAT GGCAGGTAAA CTGCGCGACT ACGAGTACTC TGAGAAAGAG 
GTCGCCATGG CGCTCGCCGG GTTGCCGTCG GTGGAGTAG

Protein sequence

MKTVKYLLAE DQMPTAWYNI QADLPTPPPP VLHPGTGQPI GPQDLAPLFP MALIMQEVST 
ERFIEIPEEV QTIYRQWRPT PLFRARRLEQ ALDTPARIYY KYEGVSPAGS HKPNTAVAQA 
YYNQQEGVKR LVTETGAGQW GSSLAMAGAF FGIEVLVFMV KVSYQQKPYR RALMEAYGAR 
VVASPSEETN AGRAILAEHP DSTGSLGIAI SEAVEVAAQD PEAKYSLGSV LNHVLLHQTV 
IGEEALAQME MAGDYPDIIV GCTGGGSNFS GISFPFIGKK LRGERNVRVV AVEPAACPSM 
TRGKYAYDFG DTAKLTPLVK MHTLGHDFVP PGIHAGGLRY HGMAPLVSHL LELGVIEAIN 
VQQLETFAAG IQFARAEGII PAPEANHAVA GAIREALRCK EEGVSRAILF NLCGHGHFDM 
QAYTDYMAGK LRDYEYSEKE VAMALAGLPS VE