Gene Tpen_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0501
Symbol
ID	4601335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	455316
End bp	456596
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	50%
IMG OID	639773268
Product	DNA primase
Protein accession	YP_919911
Protein GI	119719416
COG category	[L] Replication, recombination and repair
COG ID	[COG0358] DNA primase (bacterial type)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGGTT TACCTGTCTC ACCTAAGTAC GTGATAAAGG CTAAGATGGA GATAAAAGGA 
TCCGTCGAAA AACACGACAT AATAGGGGCT ATCTTTGGCC AGGCAGAAGG CTTGCTCGGA 
TCAGAGCTCG ACTTGAGGGA GCTTCAAAAG ACCGGCAGAG TTGGACGCAT AGAGGTGAAC 
ACCCGATCGC AGGATGGCAC CCTAGTAGCC GAGATAGAGA TACCGACGAA CCTCGACATG 
GCTGAGACTG CTATCATCGC CGCTACGATC GAGAGCATTG ACAAGGTGGG TCCTTACCCT 
GCAAAGACGG AGGTAGTCTC GATCGAGGAT GTAAGGGCGG AGAAGAGGCA GAAGATAATT 
GAGCGGGCGG TTGAGCTTTA CAAAAAGCTC CTGGAGAGCG TGCCGGAGTC CAGGGAGCTC 
GTCGAGGAGG TCTTAAGGCG TGTAAGGGTA GCAGAGATAG TGGAGTACGG AGAGGAAAAG 
CTGCCAGGAG GCCCCGAAGT TGAAACATCC GATACTGTAA TCCTTGTGGA GGGGCGTGCC 
GACGTACAAA ACCTTCTTAG ACATGGATAT AAGAACGTTA TAGCGCTTGG AGGAGCTACC 
ATACCTAAGA GCATCAAGAG TTTGGTGGAG AACAAGAAGG TTATACTTTT CGTTGACGGT 
GATCGGGGAG GAGAGCTCAT AGCGAGAAAC GTTATCAACG CGCTGAAAGT CGACTTTGTT 
GCAAGGGCTC CGCCGGGAAG GGAAGTCGAG GATCTAACTG CAAAGGAGAT AGCGAGGGCG 
CTCCAGAATA AGATCCCGGT TGACGAGTTT CTGCAAGCTC TAGAAAGGGA GAAAAAGCAA 
CAAAAAGAGG TAAAAGCAGA GATAGTAGTC CCCCCGGCAA AGCTGATAAA GTCTGCTACT 
AAAAAGAACC CGGAGATCGC GCAGGAAATC GTAGTACCAG CTGAGGTTTA CGAGAAACTC 
GAAGAGCTTA AAGGTACGCT GGAAGCCGTT ATCTACGATG AAAACTGGCA GGTCGTTGAA 
AAAGTTCCTG TAAGGGACCT TGTCAACAGG CTTAAGGAGG TTGAACGAGC GGCGCACGTA 
GTGCTCGACG GAATTATCAC TCAGCGCTTA GTGGACGTTG CGTATACGAA GGGTCTTAAA 
TCACTTATTG GAGTCAGGAT AGGAGAGATA ATAAGGAAGC CAGACAACAT TGTGCTAGCA 
ACCTTCAGTT CGGTGAAAAA GAGCGAGGAG AATATCCAGG AAAGTGTAAG CACTGGTGAG 
AGCGCTCAGA CGAGCCCCTA G

Protein sequence

MGGLPVSPKY VIKAKMEIKG SVEKHDIIGA IFGQAEGLLG SELDLRELQK TGRVGRIEVN 
TRSQDGTLVA EIEIPTNLDM AETAIIAATI ESIDKVGPYP AKTEVVSIED VRAEKRQKII 
ERAVELYKKL LESVPESREL VEEVLRRVRV AEIVEYGEEK LPGGPEVETS DTVILVEGRA 
DVQNLLRHGY KNVIALGGAT IPKSIKSLVE NKKVILFVDG DRGGELIARN VINALKVDFV 
ARAPPGREVE DLTAKEIARA LQNKIPVDEF LQALEREKKQ QKEVKAEIVV PPAKLIKSAT 
KKNPEIAQEI VVPAEVYEKL EELKGTLEAV IYDENWQVVE KVPVRDLVNR LKEVERAAHV 
VLDGIITQRL VDVAYTKGLK SLIGVRIGEI IRKPDNIVLA TFSSVKKSEE NIQESVSTGE 
SAQTSP