Gene Pars_0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0958
Symbol
ID	5055934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	849495
End bp	850484
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	56%
IMG OID	640468514
Product	aspartate kinase
Protein accession	YP_001153190
Protein GI	145591188
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.584504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0145055
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAGG TGGTCAAGAT AGGGGGTTCA CTCCTCCGAA GCTATTCAGA TTTCGTAACG 
GCGGCTCGGT TTGTTGCGTC TTTCAGAGAG CCCCCAGTTG TGGTAGTGTC GGCGGTGAAG 
GGAATAACAG ATATGCTACT CCAGCTTGAC AAGACGAGGA GCTACCTCCT CTACGAGGAG 
GTGGCCCACA GGCATATATC CATTGCCAGA TCTTTAGGAG TTGAAGAAGC CATCACGCCG 
CTGTTGAAGG ATCTGGAAAA AGCTCTCAAA CTCCCGCGGG CAGAGTGGAC GTCTGATTAC 
TTCGCCTCTT TCGGAGAGAG GCTATCCGCC ACCCTATTAC ACGCCGTCTT GAAAAAGATG 
GGGGTTGGAG CTAGGCTATT CATCGCCCCG CTTCTTACAG ACAGTAATTA CGGCAACGCG 
GAGCCCTACG CCCTAGACAG AAGGGATGAA ATCGCCCAGC CAGGCGTGGT TGCTGTTGTG 
ACGGGATACA TAGGGAGGGA TAGGTGGGGC AGGTACACCA CTGTGGGGAG GGGCGGAAGC 
GACTACACGG CGACTTATAT TGGGAAAGAG ATAGGGGCCG GCAAGGTGTC TCTCATTACA 
GACTCCCCCG GCGTCATGAG CGCCGACCCG CGGGAGGTTG GCGAGGCTTT TGTCCTGCCC 
CTCCTCTCGA TACACGAGGC CATAGAGGCG GCGAAGGTCG GCGCCAAGAA TTTCCACCCA 
CGCACCTTCA TACCGGTGGT AGAGGCCCAG ATGGCGGTGG AGGTTAGAAA CTACCACAGC 
AGAGGGACCT TGATATCATC GGTATTCTCA CCACCTCCGT ACAAGATAGT GACCCGTTGC 
GGCCAGGGTA GCTGCGTAGT GGGACTAGCC GCAAGGGAGC TGACAAAGCT AGGCGCCGTC 
CAGCTCGGCC AGTATTCAGT GAAGCTGGAC ATCCCGCCGA GGCAGGCCCA CGAGCATCTT 
GTCCTCCCCT TTCAAAAGTT TATATTGTGA

Protein sequence

MKQVVKIGGS LLRSYSDFVT AARFVASFRE PPVVVVSAVK GITDMLLQLD KTRSYLLYEE 
VAHRHISIAR SLGVEEAITP LLKDLEKALK LPRAEWTSDY FASFGERLSA TLLHAVLKKM 
GVGARLFIAP LLTDSNYGNA EPYALDRRDE IAQPGVVAVV TGYIGRDRWG RYTTVGRGGS 
DYTATYIGKE IGAGKVSLIT DSPGVMSADP REVGEAFVLP LLSIHEAIEA AKVGAKNFHP 
RTFIPVVEAQ MAVEVRNYHS RGTLISSVFS PPPYKIVTRC GQGSCVVGLA ARELTKLGAV 
QLGQYSVKLD IPPRQAHEHL VLPFQKFIL