Gene Pars_1787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1787
Symbol
ID	5055591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1607300
End bp	1608238
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	50%
IMG OID	640469332
Product	putative DNA primase, small subunit
Protein accession	YP_001153990
Protein GI	145591988
COG category	[L] Replication, recombination and repair
COG ID	[COG1467] Eukaryotic-type DNA primase, catalytic (small) subunit
TIGRFAM ID	[TIGR00335] DNA primase, eukaryotic-type, small subunit, putative

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.057405
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAACAG AGGTATTTTT CCGCAACTTT TACAGAAACT ACGCAAAGTT CGACGTAGTA 
TCTGTGGAAA GGAGAGAATT CGCCTTTCAA CCCTTCGGCG GAGGGATGGT TAGGCACAAA 
TCTTTCAATT CTGTGGATGA GCTTAGGAGG TACATCGTGG AGAAAACCCC GAAGCATATC 
TACCACTCAG TGGCGTACTA CGAAAGGCCC GGCGAGGAGG ATATGGACCG GAAGGGATGG 
CTCGGCGCCG ATCTCGTATT TGACATCGAC GGCGACCACC TCAACACCGA GGCTTGTAAA 
GGCAGTGCGG TGGTGTCCTT ACGTTGCCTC GAAGACGCCA AGGAAGAGAC CAACAAGCTG 
ATAGACATCC TTGTGCGCGA GCTCGACCTC AGACCAACCC GAATAGTATT TTCTGGGAAC 
AGGGGCTTCC ACATTCACAT CACAAGCGAG GAGGTTCTAA AGCTGGGGAC CAAGGAGAGA 
AGAGAAGTCG TTAATTTCAT AAAGGGCGTC GGCTTCGATC CCAGTAGGTT TGAGGTGAAG 
CTAGGTAGAA GGAGAGTGAA GCTCTACGAG GAAGAGCCGG TGGGTAGCCT CTTGAGAGTG 
AGACAAGCGG TGGAGAACCC CGACACGCTG AGAGTCGAAA TAGACGAAGT AGTGACTCAG 
GACATCCACC GCCTCATAAG ATTGCCCGGC TCTCTCAACG GGAAGACAGG ACTCGTGGCC 
ATGCCTCTGG AACTGAAAGA CCTAGAAAGA GGCGTTGAGA ACATCGTCGA ACGCGCCATT 
GCGTTTAGGA AAGGCAATTT AAAATTCAGA TTTGAAAAGC CGCTTATTGG TGAGGTGCTC 
TTCGAAAAAA TAGAGGCCCG TGCGGGGGAT CTGAAAATTT TGCCAGCCCA CGTGGCAATA 
TATTTAGAAC TCCAAGAGTT TGGGAAAATA TATGATTGA

Protein sequence

MITEVFFRNF YRNYAKFDVV SVERREFAFQ PFGGGMVRHK SFNSVDELRR YIVEKTPKHI 
YHSVAYYERP GEEDMDRKGW LGADLVFDID GDHLNTEACK GSAVVSLRCL EDAKEETNKL 
IDILVRELDL RPTRIVFSGN RGFHIHITSE EVLKLGTKER REVVNFIKGV GFDPSRFEVK 
LGRRRVKLYE EEPVGSLLRV RQAVENPDTL RVEIDEVVTQ DIHRLIRLPG SLNGKTGLVA 
MPLELKDLER GVENIVERAI AFRKGNLKFR FEKPLIGEVL FEKIEARAGD LKILPAHVAI 
YLELQEFGKI YD