Gene Pars_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0442
Symbol
ID	5055607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	385316
End bp	386635
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	57%
IMG OID	640468007
Product	phosphate ABC transporter, periplasmic phosphate-binding protein
Protein accession	YP_001152692
Protein GI	145590690
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR00975] phosphate ABC transporter, phosphate-binding protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTCA AACTAATAGT CCCAGCTGTC GCGGCGGTTG TGGTTATAGC AATTGCACTG 
GCGCTTCTGG CATCTTCCCC CGGCGCGGGG GTGCCTGGCA CGACTCAAAC AACGCCTAGC 
CCCAGCAAAA CTACGCCGCC TGGCTCTGGG ACAACTGGAG GGCAGAACAC ACAGCCAGCC 
TCTGCTGTGG GGCAGGGCAC TCAACAGACG CCTAGCCCTA CTCAAGCTAC GCCAAGCACT 
ACCCAGGCCA CGACCCAGCC GCCTCGTCTA AGCGGGACCG TTACTGGTGG CGGCTCAACA 
TTTATCAACC CCCAGATGAT TGCGTGGTCT AGGAGATTCT ACGAATTGAC GGGAGCCCAG 
GTCAACTACC AGTCCATAGG CTCAGGTGCG GGCGCCGCCC AGTTCTTGGC TAAGAAGCTG 
GAGTTCGCCG CGTCTGACGT CCCAATGCCA AGGGACAAGT ACGAGCAGTT TAGGGGCCGG 
TTTTTGCAAT TCCCCGTAGT TATAGGGTCT ATTGTCTTGG TGTACAATAT TCCGGAGGTG 
GCATATGAGA AGACTGGGAA GTACCTGAAC CTAACGTCTG AGGTAATCTC GCTGATCTAC 
ATGGGCGAGA TAAGGCAGTG GTGCGACGAG AGGATCCAGA AGCTGAACCC AGGTCTGAGG 
CTCCCATGCA AGGACATAGT GGCTGTACAC AGGAGCGACG GCTCTGGCAC CACTGCGGCG 
TTTACCTTGT ACCTGGCTGT GGCTTATCCG CCCTGGAACC AGACCGTGGG CTGGGGCTAT 
ACGGTGAAGT GGCCGGCTGA CGAGAAGGCT GAGGGAACAG GCGCAAAGGG CAACGAGGGC 
GTCGCCCAGA CGGTTCTCCA GACGCCCTAC TCCATCGGCT ACGTTGAGTA CGCCTATTGG 
TCGCAGAACA GAGACAAGTA CGACAAGGTC GGCGGCGTTG CCTATCTGAA AAACGACAAC 
GATGGAAAGT TCTACTTCCC CGCCGCCGAG TCCGTATCAG CCGGGGCCGA TGCAGGTTTA 
AGACGCTACG TTGCGAAATA CGGCACCCTG CCGTCTCCAG ACGCCGACTG GAACCAAGTG 
TCCATCGAAT TCACCAACCC CCCCGCCGGC TACCCGATAC TGGCCTTCGT GTATGTCTTC 
TTGTGGAAGG ACTACTCAGC TGAGGGCTAC GGCTACGCCG CAACCAAGGC CGCGTTGTTG 
AGAGAGTTCT TCAAGTGGGT TTTAACAATT GGGCAGACCC AGTTGGTGGA GGGCTACATA 
CCGCTACCTG AGTCTGTCGC CCAGTTAGGG CTCCATGCAT TACAGCAAGT AAAGCCATAA

Protein sequence

MNLKLIVPAV AAVVVIAIAL ALLASSPGAG VPGTTQTTPS PSKTTPPGSG TTGGQNTQPA 
SAVGQGTQQT PSPTQATPST TQATTQPPRL SGTVTGGGST FINPQMIAWS RRFYELTGAQ 
VNYQSIGSGA GAAQFLAKKL EFAASDVPMP RDKYEQFRGR FLQFPVVIGS IVLVYNIPEV 
AYEKTGKYLN LTSEVISLIY MGEIRQWCDE RIQKLNPGLR LPCKDIVAVH RSDGSGTTAA 
FTLYLAVAYP PWNQTVGWGY TVKWPADEKA EGTGAKGNEG VAQTVLQTPY SIGYVEYAYW 
SQNRDKYDKV GGVAYLKNDN DGKFYFPAAE SVSAGADAGL RRYVAKYGTL PSPDADWNQV 
SIEFTNPPAG YPILAFVYVF LWKDYSAEGY GYAATKAALL REFFKWVLTI GQTQLVEGYI 
PLPESVAQLG LHALQQVKP