Gene Pars_1878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1878
Symbol
ID	5055719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1681267
End bp	1682715
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	59%
IMG OID	640469424
Product	starch synthase
Protein accession	YP_001154081
Protein GI	145592079
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0297] Glycogen synthase
TIGRFAM ID	[TIGR02095] glycogen/starch synthases, ADP-glucose type

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGCAC CTGAACACAT CCGGCGAGTC TACATCTTGG CTATGGAGTA CGGCGGCCTC 
ATAAAGGTGG GGGGACTGGG CGAGGCCGTT AGGCAATACG CAGTAGGCCT AGCGGCTAGG 
GGGTACGACG TCACTGTGCT TATGCCGTCT CATGGCAGAC ACCTAGACCC AAACCGAGGC 
TTTGACCTAT ACCCCCTAGA CTTCAGAACT TGCGGAGAGC GATGGGGTCT AGACGGGAAG 
GCGTATCCAT ACTGCCTCGG CGCAGAGATT ACTTTTCAAG ACGGCGTTAA GATAGTAATG 
TTTAAGGGGC TCGACTACGC CACGGGGCAC ATCTTCGACC GGTGGGGCGT TTACGAGTAC 
ACGGAGGAGA AGGCGGCTCT CCTGGCCAGG GCAGTTGTGG CATTTGCCGA GAGGTTCGGC 
CCCCCCGACC TAATACACAT GAACGACTGG CCCACCGTAC CTGCCGGCAT AGCCTTGAAA 
GACCTTGGCG AGAGGAGGGG TCTCGCCATC CCCACGCTGT TCACGATACA CTTGTCCTGG 
GACTACTCCT TCCCATGGCA CTACGCCGAG TGGTCAGGCC TGGCGGATAG GCCGCACCCA 
GTGTGGCGGG TCTGTTGCCA CCGTTACGAG CACTACAGCG CCGTGTGGGA CGAGGGCGGG 
GGGAGCGTGG AGAGGTTCGG CGTGGTTGAG GCAGACGCGG TGTCGACAGT GAGCTACGGG 
TATCTCCAAG AGCTGTTTAG GAAATACGGA GAGTGGATTA GGGAGAAGTC GTGCGTGGTT 
TACAACTCCA CTGACTGGTC TCTAAAAGAC GTAGAGGGGG TGTCGGAGTC GGACACATGG 
CGTCTGGTAG AAGAGGTGGA GCGCATGGGC GTAGTGGGCT GGCTGGATAG GAGGGGCGTC 
CTATTCCTAG CTGTGGGGAG AATAACATCG CAGAAGGGGT TTGACATAGC CGTCAAGGCG 
CTTGACTACG CCCCCCATGC GCGGCTCTTG ATACTCGGCG TACCCGCAGG GGAGTGGGGC 
TACGAGGAGT ACGTGAAGAG CCTCGTCTGG GAGCGGCGGG GCAGAGTAGC CCTCTCAACG 
GCCAAAATCC CACCTAGACT CTACAAGGCG TTGCACTACG TGGCAAAGGC CTTGGTAATG 
CCCTCAAGAT GGGAGCCCTT CGGCATCTCG GCCATCGAGG CTATGGCGCT GGGCACTCCA 
GTAATAGCGC CGGCAGTTGG AGGACTCCCC GAGGTCGTGG GCGAATACGG CATATTAGTT 
GACCCTGAAA ACCCCGAAAA GCTGGGCAAA GCCATGGAGG AGCTGGCAAC TGGCGCTGTC 
AGCCTTCCCT CACGGGAGCG TATTGCCCAG TATGTCGATG CCAAGTTCAG GATGAGGAAT 
ACGATAGACA TGCTCGAGCA GTGCTACCAG AGCGCGAGGC TCTTTGCATA TTACCGGGCT 
CACAGCTAG

Protein sequence

MRAPEHIRRV YILAMEYGGL IKVGGLGEAV RQYAVGLAAR GYDVTVLMPS HGRHLDPNRG 
FDLYPLDFRT CGERWGLDGK AYPYCLGAEI TFQDGVKIVM FKGLDYATGH IFDRWGVYEY 
TEEKAALLAR AVVAFAERFG PPDLIHMNDW PTVPAGIALK DLGERRGLAI PTLFTIHLSW 
DYSFPWHYAE WSGLADRPHP VWRVCCHRYE HYSAVWDEGG GSVERFGVVE ADAVSTVSYG 
YLQELFRKYG EWIREKSCVV YNSTDWSLKD VEGVSESDTW RLVEEVERMG VVGWLDRRGV 
LFLAVGRITS QKGFDIAVKA LDYAPHARLL ILGVPAGEWG YEEYVKSLVW ERRGRVALST 
AKIPPRLYKA LHYVAKALVM PSRWEPFGIS AIEAMALGTP VIAPAVGGLP EVVGEYGILV 
DPENPEKLGK AMEELATGAV SLPSRERIAQ YVDAKFRMRN TIDMLEQCYQ SARLFAYYRA 
HS