Gene Pars_0161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0161
Symbol
ID	5056356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	147036
End bp	148256
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	60%
IMG OID	640467740
Product	adenylosuccinate lyase
Protein accession	YP_001152428
Protein GI	145590426
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.576792
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCATGT ACACCTCGCC TTTTGATTGG CGCTATGGGT CGGAGGAGAT GCGCCGCCTC 
TTCACGCCGC AGGCGTTTAT CGACACGTAT CTGGAAGTGG AGAGGGCGCT TGTCTGCGCC 
TTGGAGGAGC TGGGGATAGC TGAGAGGGGG TGTTGCGAAG CCGTAAGCAA GGCGCGGGTA 
GGCGCTGAGG AGGTATACGC CTTGGAGAAG GAGACGGGCC ACGACATCCT CAGCCTAGTA 
CTGTTGCTGG AGCAGAGGAG CAACTGCCGC TTCGTGCACT TCGGTGCCAC CTCAAACGAC 
GTTATAGACA CGGCGTGGGC CCTCCTGATA AGGCAAGCGA TCTCTCTGGT CAAGGAAAAG 
GCCAAGGCTG TGGGGGAGGA GCTGACCCGC CTGGCGAGGA GGTACAAGGA GCTTGAGATG 
GTGGGGAGGA CCCATGGCCA GTGGGCAGAG CCAATCACTC TAGGCTTCAA GTTCGCAAAC 
TACTACTACG AGCTGTACAT CGCGTGTAGG CAGCTGGCGC TGGCCGAGGA GTTTGCAAGG 
GCTAAGATCG GCGGCGCAGT GGGCACCATG GCCTCTTGGG GGGAGCTGGG CCCCGAGGTG 
AGGAGGCGGG TCGCCCAGCG GCTGGGTCTG CCGTACCACC CCATTACGAC GCAAGTGGCG 
CCGCGGGAGG CCTTCGCCGT CCTCGCCTCG GCGCTGGCGC TGATGGCCGC GGTGTTTGAG 
CGCCTAGCCG TGGAGATAAG GGAGCTTTCT AGACCGGAGA TCGGGGAGGT GGTGGAGCGG 
GGCGGCGGCT CTTCGGCCAT GCCCCACAAG GCAAACCCCA CGGCGTCTGA GCGCATCGTG 
AGCTTGGCGA GACACATCAG GGCGCTACTC CACGTCGCAT ATGAGAACAT AGCGCTTTGG 
CACGAGCGCG ACTTGACAAA CTCGGCAAAC GAGCGGGTTT GGATCCCCGA GGCCTTCCTC 
GCCGTCGACG AGATCTTAGC CACGGCATTG AGGGTGTTGC GCAATGTGTA CATAGACGAG 
GCAAGGATTC AAGAAAACTT GCAGAAGGCC CTACCCTACA TCTTGACGGA GTTCCACATG 
CTAAGGATGA TAAGAGAGGG GGTAAGCAGG TCTGAGGCTT ATAAGAAGGC CAGGGAGATA 
AGGGCTGTTG TGTACGACTA CCAGCGCTGG CCTGTGGATA AGCTAATTGA GGACGCCCTT 
TCCCTAAAGC TTTGCGAATA G

Protein sequence

MGMYTSPFDW RYGSEEMRRL FTPQAFIDTY LEVERALVCA LEELGIAERG CCEAVSKARV 
GAEEVYALEK ETGHDILSLV LLLEQRSNCR FVHFGATSND VIDTAWALLI RQAISLVKEK 
AKAVGEELTR LARRYKELEM VGRTHGQWAE PITLGFKFAN YYYELYIACR QLALAEEFAR 
AKIGGAVGTM ASWGELGPEV RRRVAQRLGL PYHPITTQVA PREAFAVLAS ALALMAAVFE 
RLAVEIRELS RPEIGEVVER GGGSSAMPHK ANPTASERIV SLARHIRALL HVAYENIALW 
HERDLTNSAN ERVWIPEAFL AVDEILATAL RVLRNVYIDE ARIQENLQKA LPYILTEFHM 
LRMIREGVSR SEAYKKAREI RAVVYDYQRW PVDKLIEDAL SLKLCE