Gene Pars_1917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1917
Symbol
ID	5055252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1722707
End bp	1723756
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	55%
IMG OID	640469463
Product	DNA primase large subunit
Protein accession	YP_001154116
Protein GI	145592114
COG category	[L] Replication, recombination and repair
COG ID	[COG2219] Eukaryotic-type DNA primase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACATGTG ATATTTCGCT TAGAGAATTC GCCTGCTACT TCCCCTTCCT CAATAAGTCC 
GCCTCATACC TACAGAAAAG GGGCTACCTA CTTGACGTGG CGCTTAGCGA TAAAAAACTC 
TTGGAAAAGG CAGTTGAGAG GCTGAAGAGG GCCCTTGCCC ACGAGCGGAT AGCTCTCCGT 
CCATGTATAG ACAGCCCCGA GGAGGCGGCA GCCGCGGCGA GGCTGGCCCT GTACATCGCC 
GCAGCTACTA GAAATACCCA CGTGCTCCGC AGGTTTGCAG ACAGCGAAAG TAAAAATTTC 
AAGGATATCC TAGAAAAAAC GCCTGGGATA CAAAGTCCAG AATGTAAGCT TGAAATAGCA 
AGGGACCTAG GTATTGTTAC GAGGCAAGCC CAAGAAGTGG CGCCAGGCCT ATTGTCAGTG 
GCCTACAAGA TGCCAATGGC CGTGAGGTGG ACTGCATATG TTCGCTACGC CCCCCAAGAT 
CCGTACTGGG CTATGATAAA CCGGCCCGTC GTGAAGGGGT GGGTAATACT GCCAATTGAG 
GATTTCGAGA GGTTGCTCGA GGAGGCGTAC GAGGAGCGGA TAGTTAGGAC TGTTGCTGAG 
AACGAGCTTG CGGTGGGCAG AGTGGCCGCT TCGCTTGACC CCGCGCTGTT GGACGAGCTT 
GTGAAGCAGT ACGGCCAGAG GCCTGTGCGG GTGGAGGCTA GGGCAATGCC GGGCCCTGAC 
CCGCCCTGCA TGCGGGCGTT GATCGACGCG TTAAAGGCCG GCGAGAACCT CCCCCACACA 
GGGAGGTTTG CCATAACTAC ATATTTGCTA CATAGGGGGT GGGATGTGGA GCAGATAGTT 
GACCTCTTCA GAAACGCGCC CGACTTCAAC GAAAAGATCA CGAGGTACCA GGTACAGCAC 
ATCGCCGGGC AGGCAGGGGG CAGGAAACAA TACTCGGTGC CCAGCTGTGA GACCATGAAC 
TCTTGGGGCC TATGCCCCAC AAATCTCGGA TGCGGCATAA GAAACCCAGT AGTATATGGG 
CGCAGAGTCG CGGCTAGAAA AAGTAGCTGA

Protein sequence

MTCDISLREF ACYFPFLNKS ASYLQKRGYL LDVALSDKKL LEKAVERLKR ALAHERIALR 
PCIDSPEEAA AAARLALYIA AATRNTHVLR RFADSESKNF KDILEKTPGI QSPECKLEIA 
RDLGIVTRQA QEVAPGLLSV AYKMPMAVRW TAYVRYAPQD PYWAMINRPV VKGWVILPIE 
DFERLLEEAY EERIVRTVAE NELAVGRVAA SLDPALLDEL VKQYGQRPVR VEARAMPGPD 
PPCMRALIDA LKAGENLPHT GRFAITTYLL HRGWDVEQIV DLFRNAPDFN EKITRYQVQH 
IAGQAGGRKQ YSVPSCETMN SWGLCPTNLG CGIRNPVVYG RRVAARKSS