Gene Pars_1418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1418
Symbol
ID	5056425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1278824
End bp	1280053
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	63%
IMG OID	640468959
Product	tryptophan synthase subunit beta
Protein accession	YP_001153628
Protein GI	145591626
COG category	[R] General function prediction only
COG ID	[COG1350] Predicted alternative tryptophan synthase beta-subunit (paralog of TrpB)
TIGRFAM ID	[TIGR01415] pyridoxal-phosphate dependent TrpB-like enzyme

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.955959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.212378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTAGACA GGTGGTACAA CATCGCCGCT GACCTCCCCG CTGTCTTGGC TCCTCCCAAA 
GACCCAGACG AGGGCGAGAG TAGAATCGGC CTGCTTACGA GAATACTCCC ATCCGCGCTT 
ATAGACCAAG AATTTTCTGC AGAGCGCTGG ATTACTGTTC CAGAAGAGGT TAGAGACGCG 
TACCGGCGTG TTGGTAGGCC GACGCCCCTC CTCCGCGCCG AGGGGCTGGA GAGGGCTCTG 
GGCACGGGGG TGAGGATATA CTACAAGTAC GAGGGGGTGC TCCCAGTGGG TAGCCACAAG 
CTCAACACTG CCCTGGCACA GGCCTACTAC GCCAAGGCCG ACGGCGCGGT GGAAGTGGCC 
ACCGAGACGG GGGCGGGGCA GTGGGGCATG GCTGTCTCCC TCGCGGCTGC TCTCTTCGGC 
CTAAAGGCAG TGGTGTTTAT GACCCGCTCC TCCTACAACT CAAAGAGGCA GAGGCTGACC 
TTTATGAGGA CTTACGGCGC GACGGTGTAC CCCAGCCCCA GCGAAGTGAC GGAGGCGGGG 
AGGAGGCATT ACCGGCCGGA CCACCCAGGC TCGCTGGGGA TCGCAATATC GGAGGCAGTG 
GAGTACGTCC TATCCGGCGA GAAGAGGCAC TACCTTCCGG GCAGCGTCTT GGAGTTCGTG 
CTCATGCACC AGACCGTCAT AGGACTAGAG GCGGTTAGGC AACTGCCGGA GGAGCCGGAC 
GCCGCCGTGG CCTGCGTTGG CGGGGGGTCG AACTTCGCCG GCTTTACCTA CCCCATGATC 
GGGATGAAGC TGAGGGGCGA GGGCTTCGAC AAGACGAGGT TCGTCGCAGT TGAGGCGGAA 
GCCGCCCCCA AGCTCACAAA GGGGGAGTAC AAATACGACT TCCCAGACGC CGTGGGGATA 
CTCCCCATGA TCAAGATGTA CACCTTAGGC CACGACTACG TCCCGCCGCC CGTCCACGCG 
GCCGGCCTCC GGTACCACGG CGCCGCGCCG TCCCTCTCCT TGCTTCGGAA ATTGGGGATA 
GTGGAGCCGC TCTCCTACCC CCAGGAGGAG GTCATGAAAG CCGCAGTGCT CTTCGCGAGG 
ACGGAGGGCA TTGTACCGGC GCCGGAGTCG GCCCACGCGA TAAGGGCAGT GCTAGACCTC 
GCAAAAAAGC TCCCGCGCGG CTCGGTAATA GCGTTCAACC TCTCCGGCCA CGGCCTCCTC 
GACTCCGACG CCTACGAGAA GTTCCTGTAA

Protein sequence

MVDRWYNIAA DLPAVLAPPK DPDEGESRIG LLTRILPSAL IDQEFSAERW ITVPEEVRDA 
YRRVGRPTPL LRAEGLERAL GTGVRIYYKY EGVLPVGSHK LNTALAQAYY AKADGAVEVA 
TETGAGQWGM AVSLAAALFG LKAVVFMTRS SYNSKRQRLT FMRTYGATVY PSPSEVTEAG 
RRHYRPDHPG SLGIAISEAV EYVLSGEKRH YLPGSVLEFV LMHQTVIGLE AVRQLPEEPD 
AAVACVGGGS NFAGFTYPMI GMKLRGEGFD KTRFVAVEAE AAPKLTKGEY KYDFPDAVGI 
LPMIKMYTLG HDYVPPPVHA AGLRYHGAAP SLSLLRKLGI VEPLSYPQEE VMKAAVLFAR 
TEGIVPAPES AHAIRAVLDL AKKLPRGSVI AFNLSGHGLL DSDAYEKFL