Gene Pars_0962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0962
Symbol
ID	5055467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	853388
End bp	854356
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	51%
IMG OID	640468518
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001153194
Protein GI	145591192
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.000380465
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAATCC TCGAAGTTAG GAATCTGACA GTATACTTCT ACACCTACGC CGGCGTGGTG 
AGAGCCGTGG AGAACGTGTC CTTTGACCTG TACAAAGGGG AGACTTTGGC CATCGTTGGT 
GAGACTGGTA GCGGCAAGAG CGTGACTACT AGGGCGATAA CGAGACTCGT GTCGCCGCCA 
GGAAAAATAG TATCAGGATC AGTTATTTAT AGGAGAGACG GAGAGGAGCT AGATCTTCTT 
AAGCTACCAG ATGAGGAGCT GAGGAAAATA AGGGGGTCGG AGATAGCCTA CGTCTTTCAA 
GACCCCTCTT CTGCTCTTGA CCCGCTGTAC ACAGTCGGCT ACCAGATATC GGAGACTGTG 
GCGGCCCACA GAGGAGGTAA GATAAAGCAA TACTTGGGAG AAGCTGTGGA ATTGCTTAGA 
AGGGTCCTCA TCCCCGATCC TGAGAGTAGG TCAAAGGCGT ACCCCCACCA GCTTTCTGGA 
GGCATGAAGC AGAGGTCCGT AATTGCCATG GCTATTAGTA ATAGGCCGAA GATATTAATT 
GCCGATGAGC CCACCACAGC CGTCGACGTC ACTGTGCAGG CCCAGTTGCT TCACTTATTT 
AAGAAGCTGA AAGAGGAGAT CGGCATGTCT ATTATTTTCA TAACCCACAA TATGGGCCTC 
GTCGCTGAGC ACGCAGATAG GGTTATCGTT ATGTACGGCG GAAAAATAGT CGAGGAAGGA 
CCTGTAGATG AGGTATTCGA AAACCCGAGA CACCCCTATA CCCAGGGCCT TCTAAGAGCC 
GTGATAAACC CCATCAAGAC TCAGGAACGG CTAGAGCCTG TGCCGGGCAC AATACCCAAC 
CTCATAAATC CGCCTGCCGG TTGCCGCTTC CACCCCCGCT GCCCCTACTT CATAAAAGGA 
AAATGCGACG TGGAAGAGCC GCCCCTTGTA GGCGACAGAC ACAAGGTAGC TTGCTGGTTG 
TACGTATGA

Protein sequence

MKILEVRNLT VYFYTYAGVV RAVENVSFDL YKGETLAIVG ETGSGKSVTT RAITRLVSPP 
GKIVSGSVIY RRDGEELDLL KLPDEELRKI RGSEIAYVFQ DPSSALDPLY TVGYQISETV 
AAHRGGKIKQ YLGEAVELLR RVLIPDPESR SKAYPHQLSG GMKQRSVIAM AISNRPKILI 
ADEPTTAVDV TVQAQLLHLF KKLKEEIGMS IIFITHNMGL VAEHADRVIV MYGGKIVEEG 
PVDEVFENPR HPYTQGLLRA VINPIKTQER LEPVPGTIPN LINPPAGCRF HPRCPYFIKG 
KCDVEEPPLV GDRHKVACWL YV