Gene Pars_1733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1733
Symbol
ID	5054891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1560189
End bp	1561157
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	47%
IMG OID	640469276
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001153936
Protein GI	145591934
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.856595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.000426815
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGCCACCTC TCTTGGAGTT ACGAAATGTG AAGATGTACT ACAACACAAC AAGGGGAACT 
GTGAAAGCCG TTGATGGGAT TTCTTTTAAG CTGGAAAAAG GAGAGGCCAT GGCCTTGGTC 
GGAGAGAGCG GAAGCGGAAA AAGCTCGCTC GCTTTTACGA TAATAAGGCT GTTGCCTAGG 
AACGTAGCGG AGTCAGGTGG CGAGATCTTG TTTTATGACG AAGAACTTGG AGTAGTAGAT 
CTGATGAAGA TGTCTGAAAG CGAGATTAGA AGAAAGATTA GGTGGAAGAA GATATCCATG 
GTGTTTCAAG CTTCTATGAA CGCGCTAAAC CCCATATTAA GAATACAAGA TCAGATGATT 
GAGCCGCTTG TGCTTCACCT AGGTATGTCT AAAGAAAGCG CGGTAAAAAT CGCCGAGGAG 
GCTCTCAGAT CAGTGGGCTT ATCTCGAGAT GTCCTGTCTA GATACCCCTT CGAACTATCG 
GGCGGTATGA AACAGAGAGT GGTCATAGCT ATGGCAATAA TGATGAGGCC CAGGCTAGTT 
ATCTTAGACG AGCCGACGTC AGCTCTGGAT GTCATTACCC AGGCTAATAT TATGAATTTG 
TTAAAGGAGC TTAAGGCCAA GTTCGACTTA TCATATATCT TAATTACTCA CGACATAGCA 
CTCGCCTCCG AGATAGCCGA TAAAATAGGC GTTATGTACG CAGGTAAGCT GGTGGAGGTA 
GCCCCCGCAG ATCTCTTCTT TAGGTGGCCT AAACACCCGT ACTCTCAGAA ATTACTAGCC 
GCAATGCCGA CGTTGAGAGA GGACAAGAAA ATTGAGCACA TACCTGGAGA TGTCCCAAGT 
CTCATTAATC CTCCGCCTGG CTGCCGCTTC CACCCCAGAT GCCCCTACGC CATAAAAGGC 
AAATGCGAAA AAGAAGAACC GGCAGTGAAA GACGTGGAGG GCAGTCTAGT GGCCTGCTGG 
CTGTACTAG

Protein sequence

MPPLLELRNV KMYYNTTRGT VKAVDGISFK LEKGEAMALV GESGSGKSSL AFTIIRLLPR 
NVAESGGEIL FYDEELGVVD LMKMSESEIR RKIRWKKISM VFQASMNALN PILRIQDQMI 
EPLVLHLGMS KESAVKIAEE ALRSVGLSRD VLSRYPFELS GGMKQRVVIA MAIMMRPRLV 
ILDEPTSALD VITQANIMNL LKELKAKFDL SYILITHDIA LASEIADKIG VMYAGKLVEV 
APADLFFRWP KHPYSQKLLA AMPTLREDKK IEHIPGDVPS LINPPPGCRF HPRCPYAIKG 
KCEKEEPAVK DVEGSLVACW LY