Gene Pars_0657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0657
Symbol
ID	5055605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	584999
End bp	586039
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	57%
IMG OID	640468217
Product	saccharopine dehydrogenase
Protein accession	YP_001152900
Protein GI	145590898
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATAC TGCTAATGGG ATGCGGCAAC ATAGGGAAGT ACATCTACAA CGCTCTTTCC 
CAGAGGCACG AAGTAGCCGT GGCCGACAAG GCCGGGGGGT GTCCTTCTAC CATTGCTCGC 
GACGCTCTGG AGGTGCCCCT CGGCGGGTAC GATCTTGTAA TCAACGCGTT GCCTGGGAAT 
ATTGCGTATA AGGCGTCGCG GCGGGCCTTA GAGGTGGGTG TCGACGTTGT AGATGTATCG 
TTCTTCCCGG AAGACCCCTT TGAACTCGAC GAGGTGACAA AGAAAAGCGG GGCTAGGTAC 
ATCCCAGATG CGGGGGTTGC TCCTGGGCTT AGCAACGTGT TGGCAGGTAG GTTGGTGGCG 
GAGCTGGGCA AGGTTGACGA GCTGGGCATA TACGTGGGGG GCATACCCGA GAGACCCGTC 
GGTCCTCTCG GGTATTCAAT AACGTGGAGC CCCCTAGACC TAATTGAGGA GTACACGAGA 
CCGGCCAGGG TGAGGAGGAG CGGCGAGTTA GTGTCGGTTG ATCCGCTCAG CGGCGTTGAG 
CTCGTCCCCT CGCCTCTTGG GATGCTTGAG GCGTTCTACA CAGACGGCCT ACGCACACTC 
CTGAAGACGC TGGACGTCCC TAACATGTAC GAAAAAACGT TAAGGTGGCC AGGCCATATA 
GAAAAGATCA AACTTCTTCG CGATTTGGGG TTCATGTCGG AGGAGGGGGA TCCGCCCCCG 
CGCCTAGTGA CGGCTAATCT GCTTTCCCGC CTCAAATTCG ATGTGCCTGA TGTGGTATAT 
ATGAAGGTTG TAGGGAGCGG CGGCCAGAAG AAAGTTCAAT ATGAAGTCAC CGTCAGGCCT 
CGCGCCGGGT GGACTGCGAT GCAGGTGGCG ACTGGTAGCG TCGCCATAGG GATGCTGTAC 
GTGATCAAAG ACCTAGATCC AGGCGTGACG CCGCCCGAGT ACATCGGCAT GTCCAACAGG 
CTCTTTCCCC GGCTCCTCGC CGCTGTAAGG CAACACGGCG TGGAAATCGT CCAAGAGATA 
GTAGAAAGAA GAGCGCTATG A

Protein sequence

MKILLMGCGN IGKYIYNALS QRHEVAVADK AGGCPSTIAR DALEVPLGGY DLVINALPGN 
IAYKASRRAL EVGVDVVDVS FFPEDPFELD EVTKKSGARY IPDAGVAPGL SNVLAGRLVA 
ELGKVDELGI YVGGIPERPV GPLGYSITWS PLDLIEEYTR PARVRRSGEL VSVDPLSGVE 
LVPSPLGMLE AFYTDGLRTL LKTLDVPNMY EKTLRWPGHI EKIKLLRDLG FMSEEGDPPP 
RLVTANLLSR LKFDVPDVVY MKVVGSGGQK KVQYEVTVRP RAGWTAMQVA TGSVAIGMLY 
VIKDLDPGVT PPEYIGMSNR LFPRLLAAVR QHGVEIVQEI VERRAL