Gene Pars_2136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2136
Symbol
ID	5055873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1910820
End bp	1912148
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	54%
IMG OID	640469688
Product	periplasmic binding protein
Protein accession	YP_001154334
Protein GI	145592332
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTTGT CAAAAGAGTT CCTGGTAGCG TCGGCGGCAT TTGCGCTTTC GATTATTGCT 
TTGGCAATAG CGGTACAGGC CTTGGGGCAG TTATCATCGT CGCTAATCTC TCTCAAGGCA 
GATGTCACCG ACAAGTTAAA TATCCTGGAG AAAAAGGTGG GAGAGCTTCA GCAACAGTTA 
AGCATATCCA CGAGCGAACT CAGAGGTTCT CTTCAGAGCG AAATCTCCGG CGTTAACAAA 
ACTTTGTCTG AGCTTAGGCA GGAAGTGACG CTTCTTAGGC GTGTGGCGTC TATGCCCTCT 
GGCCAAGTGT CTGTCAAATA CGCCAGCTTT TACCTGGCTT ACGAGGGCGG GGCCTACCTT 
CTTAAGGACT CCATGGGACG GAGAGTTTTG CTACTGCCAC GGGGGATTGA AGCGCCTCTT 
GCCTCGTATC TAGAAGCGAA GTATAGACCC GACCTCGTTG TGATTTACCC AGTAGAGAGG 
GCTGTTTTTA TGGCCGCTAC CCAAGTTGCC ATGGTCTACC GGCTGTATAA CGAGACTGGG 
GACCCGCGCT TCTTGAGGTC AATCGCCGGC ATTATGTGGG GCAGGGACTA CGAGTGGTAT 
CTCCCCGAGG TTAAGGCCAT GCTCCAAAAC GGCACTATAA AAGACGTCGG ATCTGCCTAT 
TCTCCAAACT ACGAGGCCAT ATTGGCCCTG AAGCCCGATG TTGTCTTCGT ATACTTCTCC 
CCCGGCCCCT ACGGCACAGA GGCCGTAATT CAAAGGCTTC AACAGCTGGG CGTCCCCTAC 
GTCGTCGTGA ATGAGTTCAA CGAGAGGAGC CCCCTGGGGA GGTTCGAATG GGTCAAGGCA 
GTAGCCGCGT TTTTCAACGC GACGGACAAG GCAGTTGCGG TATTCAACAA GGTGGAGGCG 
AGGTGGGACC AGCTGGCGTC CTTAGCCGCG GATTTAGACA GGCCGAGGGT GGCGTGGTTT 
ATCATATACC AAGGCATTCT ATACCCCGCA GGTCCGGCGG TAAGGGAGCT AATAAGACTG 
GCGGGGGGCA GATACGCCTA TGCCAACTAC AGCCGGGTTG ACCTCGAAGT CGTGTTGAAG 
CACAGAAACG ACGTTGACGT GCTCATATGG TCGGGTTACG GCGTGTCAAA GATAGAGGAC 
ATAGTGAAGA TAGAGCCGAG ACTCAAGGAA CTTAGGCCAG TCGTGACTGG CAGGGTGTAC 
GCATACAGCC CCGCCTTTTA CCAGCTGTCC AACGCCTACC CAGAGCGCGT CCTTGAAGAG 
CTCGTGTCGA TAATACACCC CGAGATCTCT CCGCCGGGTA GGCTAACGCT CTTCATCCAG 
TTGCAGTGA

Protein sequence

MQLSKEFLVA SAAFALSIIA LAIAVQALGQ LSSSLISLKA DVTDKLNILE KKVGELQQQL 
SISTSELRGS LQSEISGVNK TLSELRQEVT LLRRVASMPS GQVSVKYASF YLAYEGGAYL 
LKDSMGRRVL LLPRGIEAPL ASYLEAKYRP DLVVIYPVER AVFMAATQVA MVYRLYNETG 
DPRFLRSIAG IMWGRDYEWY LPEVKAMLQN GTIKDVGSAY SPNYEAILAL KPDVVFVYFS 
PGPYGTEAVI QRLQQLGVPY VVVNEFNERS PLGRFEWVKA VAAFFNATDK AVAVFNKVEA 
RWDQLASLAA DLDRPRVAWF IIYQGILYPA GPAVRELIRL AGGRYAYANY SRVDLEVVLK 
HRNDVDVLIW SGYGVSKIED IVKIEPRLKE LRPVVTGRVY AYSPAFYQLS NAYPERVLEE 
LVSIIHPEIS PPGRLTLFIQ LQ