Gene Pcal_2117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_2117
Symbol
ID	4908459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	+
Start bp	1960730
End bp	1961770
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	56%
IMG OID	640125871
Product	flap endonuclease-1
Protein accession	YP_001056998
Protein GI	126460720
COG category	[L] Replication, recombination and repair
COG ID	[COG0258] 5'-3' exonuclease (including N-terminal domain of PolI)
TIGRFAM ID	[TIGR03674] flap structure-specific endonuclease

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGTTA CTGAGCTAGG CAAACTCATT GGAAAAGAGG CTAGGCGTGA GATAAAGCTG 
GAAAGTTTGG CCGGCAAGTG CGTTGCCCTC GACGCCTACA ACGCGCTTTA CCAATTTCTC 
GCGTCTATCC GCCAGCCCGA TGGAACTCCG CTTATGGACC GCGCGGGGCG TATAACCAGC 
CACCTCTCCG GCCTATTTTA CCGCACGATA AACCTACTAG AGGCGGGGGT TAAGCCTGTG 
TATGTATTCG ATGGGAAGCC CCCCGAATTT AAGCTCCTAG AGATTGAACA GCGGAAGAAG 
GCCAAGGAGA AGGCTTTGGA AGAGGTGGAG AAGGCAATAA GGGAGGGGAG GAGGGAAGAC 
GTGGCCAAGT ACGCAAAGAG GGCGATCTTT TTGACGAGTG AGATGGTGGA AGATGCAAAG 
AAGTTGTTGA CCTACATGGG TATCCCGTGG GTGCAAGCCC CAAGCGAGGG CGAGGCGCAG 
GCCGCCCACA TGGCCAAGAG GGGGCACTGC TGGGCCGTGG GTAGCCAAGA CTACGACTCT 
CTGCTTTTCG GTTCGCCCCG CCTAGTTAGA AACCTAGCCG TGTCTCCCAA GAGAAAGGTA 
GGGGAGGAGG TGGTGGAGCT CTCGCCAGAG TTAATAGAGC TAGACGCTGT GCTTAAATCG 
CTCAAGCTGA AGGGCAGGGA GCAGTTAATC GACTTGGCGA TACTCTTGGG CACAGACTAC 
AACCCAGAGG GGGTGCCGGG TGTGGGGCCT CAGAAGGCGC TCAAGCTCAT ATGGGAGTTC 
GGGAGCCTAG AGAAGCTCCT CCAGACCGTG CTAAAGGGCG TGCAATTCCC CGTAGACCCG 
CTTAAGATTA GGGAGTTCTT CCTAAACCCG CCTGTCACAG ATCAGTACAG CACAGAGCTC 
TCTACCCCCG ACGAGAGAAA GATCGTGGAA CTGCTCGTCG AAGAGCACGA CTTCTCACAG 
GAGAGAGTGG CCAAGGCCTT GGAAAGATTG GCTAAGGCCA GGGGGAAGGT TAAGACAACG 
TCTCTCGACG CGTTTTTCTA A

Protein sequence

MGVTELGKLI GKEARREIKL ESLAGKCVAL DAYNALYQFL ASIRQPDGTP LMDRAGRITS 
HLSGLFYRTI NLLEAGVKPV YVFDGKPPEF KLLEIEQRKK AKEKALEEVE KAIREGRRED 
VAKYAKRAIF LTSEMVEDAK KLLTYMGIPW VQAPSEGEAQ AAHMAKRGHC WAVGSQDYDS 
LLFGSPRLVR NLAVSPKRKV GEEVVELSPE LIELDAVLKS LKLKGREQLI DLAILLGTDY 
NPEGVPGVGP QKALKLIWEF GSLEKLLQTV LKGVQFPVDP LKIREFFLNP PVTDQYSTEL 
STPDERKIVE LLVEEHDFSQ ERVAKALERL AKARGKVKTT SLDAFF