Gene Pars_0959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0959
Symbol
ID	5055340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	850481
End bp	851476
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	60%
IMG OID	640468515
Product	threonine synthase
Protein accession	YP_001153191
Protein GI	145591189
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0152595
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTGGCGCT ACGCCTCTAT GCTCCCGCTT AAAAAAGGCA TAACTCTTGG CGAAGGCGCT 
ACCCCCCTTG TCAAGTCCAA CTTAGCAGAA GGTCTATACG TCAAGTTCGA GGGGGCTAAC 
CCCACCGGCA GTTTTAAGGA TCGGGGCATG GCGCTCGGAG TCACAGTGGC AAAGGAGAGC 
GGCGCAAACA AAATACTCGT CGCTTCGACC GGCAATACGG CCGCGTCCGC CGCAGCCTAC 
GCCGCCAGGG CGGGGATGAG GTGTTACGTA GTGCTCCCCA GGGGCAACGT GGCAAGGGGG 
AAGCTAATGC AAGCCGCCCT CCACGGGGCG GAGATCGTGA TGATCAACGG CCTCTTCGAC 
AAGGCCCTCG AATACGTGGT AAACTACGGC ACTAAGTACG CCTACCCCCT AAACAGCTTC 
AACCCCTGGC GCCTCGAGGG GCAGAAGACT GTGGCTTTTG AAATATTCGA GGAGCTCGGT 
TGCCCCGACT ACGTGGTTGT GCCGGTAGGC AACGCCGGAA ATATCTCGGC CATCTGGAAG 
GGGTTTAAAG AACTGGCGGA GCTGGGCTTG TGCAACAAGC TTCCGCGGAT GGTGGGCGTG 
CAGGCAGAGG GCGCCGCCCC GCTTGCCGAG GCGTGGGAGA GGGGGCTGGA GGAGCCCCTA 
TTCGTCGACG AGCCGAGGAC GGTGGCGACT GCGATAAAGA TCGGGAGACC TATAAACTGG 
CCCAAGGCAG TTAGGGCCGT GAAGGAGTCA GGCGGCTTCT TTATCAAGGT CCAAGACGGC 
GAAATCTTAA AGGCGCAACG AGAGCTAGCG CAGAGAGACG GAATAGGCGC CGAGCCCGCC 
GGGGCGGCCT CGGTTGCAGG TTTTTTAAAG GCCAAGTTGA GGGGAGTCGT GGTCGCCGTG 
GTGACGGGCC ACGCCCTAAA GGACCCCGAC GCGGTGGAGA TATCGGCAAA GGAAGTTAGG 
AACGCCGACG AGCTGATGGA GCTGTTGGAG AAATGA

Protein sequence

MWRYASMLPL KKGITLGEGA TPLVKSNLAE GLYVKFEGAN PTGSFKDRGM ALGVTVAKES 
GANKILVAST GNTAASAAAY AARAGMRCYV VLPRGNVARG KLMQAALHGA EIVMINGLFD 
KALEYVVNYG TKYAYPLNSF NPWRLEGQKT VAFEIFEELG CPDYVVVPVG NAGNISAIWK 
GFKELAELGL CNKLPRMVGV QAEGAAPLAE AWERGLEEPL FVDEPRTVAT AIKIGRPINW 
PKAVRAVKES GGFFIKVQDG EILKAQRELA QRDGIGAEPA GAASVAGFLK AKLRGVVVAV 
VTGHALKDPD AVEISAKEVR NADELMELLE K