Gene Pars_1955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1955
Symbol	pyrG
ID	5054693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1753502
End bp	1755094
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	57%
IMG OID	640469501
Product	CTP synthetase
Protein accession	YP_001154154
Protein GI	229229025
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0504] CTP synthase (UTP-ammonia lyase)
TIGRFAM ID	[TIGR00337] CTP synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTAAAT TCATATTTGT CACGGGGGGT GTAATGTCGA GTGTGGGGAA GGGGGTCGTT 
GTGGCGAGTA TTGGGCGTAT TCTTAGGGCG CGCGGCCTCT CGGTAAACGC CGTGAAGATC 
GACCCCTATA TAAACGTCGA CGCGGGGACT ATGAACCCAT ACGCCCACGG CGAGGTGTTC 
GTTACATACG ACGGGGGGGA AACAGACTTA GATCTGGGAC ACTACGAGAG GTTTCTCGAT 
GTGGAGCTTT CGCGGAGGAA CAACATCACG TCGGGTCAGG TATACCTGTC CGTGATAGAG 
AAGGAGAGGA GGGGGGAGTA CTTGGGGCAG ACGGTGCAGT TGATCCCCCA CGTCACCGAC 
GAGATTAAGA GGAGGGTTGT GGAGGCGGCT GGGGGCTTCG ACGTGACGCT GGTGGAGATT 
GGGGGCACTG TCGGCGACTA CGAACAACTG CCATTTCTCG AAGCGGCGAG GCAACTGGGC 
CTCGAGCTGG GAGAGGACGT GGTGTTTATC CACGTGGCGT GGGTGCCCTT GTTGAAGATT 
ACGGGGGAGT TTAAGACTAA GCCCCTCCAG CACAGCGTGG CTGAGCTTAG GCGGTACGGC 
ATACAGCCCG ACGCCATTGT GGTGAGGTCT GAGAAGCCGC TGGACGCCCC CTCTGTCAAG 
AAGATCGCGC TCTTCGCCAA CGTCCCACAG TGGGCTATTT TCAACTCCTA CGACGTGGAT 
ACTATATACA GGGTCCCCCT CATCTTGGAA CAACAAGGCC TCGGCGACTT CCTCGTGAGG 
AGGCTCCGGC TTCCCAGTCG CGCCCCCGAC TACAGGGAGT GGGAGGAGTT TGTGACTAAG 
CTCTCGTCGC CTAGGTATAA GGTGACTGTG GGGATGTGCG GAAAGTACGT GGAGCTCCCC 
GACGCATATT TAAGCATTGT GGAGGCGGTG AGGCACGCCG GCGCTGCCCT CGACGTTAAG 
CCGGAGCTAG TATGGATAAA CTCGGCAGAG GTGGAGAAAA ACCCAGACCT CTTGGATAAG 
GTGAGCATAG ACGCAATGAT TGTCCTTCCA GGGTTTGGCA AGAGGGGGAC CGAGGGGATG 
ATCGAGTGCG TCAGACACGC CAGGGTGCAC AAGATACCGT TCTTGGGCAT CTGCTTCGGC 
ATGCAACTAG CCGTGGTGGA ATTCGCCCGC AACGTCCTGG GGCTGAAGGG GGCTAACTCC 
ACGGAGCTAG ATCCGGAGAC GCCATACCCC GTAATCCACC TGGCGCCTGA GCAAAGGGAA 
GTGGACGTGA TGGGAGGTAG CATGATTCTA GGCAATAGGG AAATTGAAAT AGTGCCGGGG 
ACCCTTGCCT CCTCACTATA CGGCACATCG GTTATTGCGG AGCGTCACAG GCATAGATAC 
GAAGTTAACC TCTCCTACCT GCCGAAGCTC GCCGAGGCAG GTCTCGTGGT GTCTGGTTGG 
AGGAGAGATG TAAAGCGGGT GGAGATAATC GAGCTACCGT CGCATTCGTA CTTTATAGCT 
ACGCAGTTTC ACCCAGAGTT TAAATCTAGG CCTACAAAGC CGAGGCCTGT CTTCCTCGGC 
CTCCTCAAGG CCGCCCTTGC TTCTAGGAGT TAA

Protein sequence

MPKFIFVTGG VMSSVGKGVV VASIGRILRA RGLSVNAVKI DPYINVDAGT MNPYAHGEVF 
VTYDGGETDL DLGHYERFLD VELSRRNNIT SGQVYLSVIE KERRGEYLGQ TVQLIPHVTD 
EIKRRVVEAA GGFDVTLVEI GGTVGDYEQL PFLEAARQLG LELGEDVVFI HVAWVPLLKI 
TGEFKTKPLQ HSVAELRRYG IQPDAIVVRS EKPLDAPSVK KIALFANVPQ WAIFNSYDVD 
TIYRVPLILE QQGLGDFLVR RLRLPSRAPD YREWEEFVTK LSSPRYKVTV GMCGKYVELP 
DAYLSIVEAV RHAGAALDVK PELVWINSAE VEKNPDLLDK VSIDAMIVLP GFGKRGTEGM 
IECVRHARVH KIPFLGICFG MQLAVVEFAR NVLGLKGANS TELDPETPYP VIHLAPEQRE 
VDVMGGSMIL GNREIEIVPG TLASSLYGTS VIAERHRHRY EVNLSYLPKL AEAGLVVSGW 
RRDVKRVEII ELPSHSYFIA TQFHPEFKSR PTKPRPVFLG LLKAALASRS