Gene Pars_1732 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1732
Symbol
ID	5054786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1559222
End bp	1560187
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	52%
IMG OID	640469275
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001153935
Protein GI	145591933
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.561922
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.00101303
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGTTGC TGGAGGTTAA AGAACTAAGG ACGTGGTTCC CTGTGAAAAA AGGTCTCTTC 
GGCCCTACTA GGTATGTTAA GGCGGTAGAC GGGGTGAGCT TCACGCTGGA GAGAGGAGAG 
GTGCTGGCAG TGATAGGCGA GTCGGGATCC GGCAAGACCA CACTGGGGAG GACTGTGCTA 
AGACTGATAA AGCCCACTGG CGGGAAGATA ATATTCGAGG AGAAGGACAT AACCAATACG 
CCTGAGAGCC AGCTAAGGTG GTATAGGTTT TCCACTGCTA TGGTTTTCCA AGACCCCTTC 
AGCTCGTTGA ACCCCTACCA CACAGTGCAG TACATTTTAG AAGAGCCGCT TATATTGAGG 
GGGGTACCGC CGGAGGAAAG GCACGAGCTT GTAGTGAAGG CGCTGGAGGA GGTAAGGCTA 
ACGCCGCCGG AGGACTTTCT CAAGAAATAT CCGCACATGC TTAGCGGAGG CCAGAGGCAG 
CGTATTGGCA TTGCCAGGGC GTTGATCACA CGGCCTAAGT TCGTAGTGGC AGACGAGCCT 
GTATCTATGC TGGATGTTTC AATCAGAGCT GAAATACTAT CCCTTATGAG GAGTCTGCAA 
GAGAAGTACG GCATCACAAT GATATACATC ACACACGACA TTGCCACTGC CAAGTATTTG 
TCAGACAAGA TCTTGGTAAT GTACGCCGGG AAGATGGTGG AATACGGGCC GTTTAGAGAT 
GTCATAAAAG AGCCTCTACA TCCGTACACC CAAGCGCTGA TCGAGGCTCT GCCCGACCCT 
GACCCTACAA ATAGGTTTAG AACTAGGAGG GTGCCGCCGG GCGAGCCGCC AAGTCTCATT 
AATCCTCCGC CTGGCTGCCG CTTCCACCCC AGATGCCCCT ACGCCATAAA AGGCAAATGC 
GAAAAAGAAG AACCGCCCTT TATTGAGGCG AAGAAAGGTC ACTACGTCGC TTGTTGGCTT 
TATTAG

Protein sequence

MPLLEVKELR TWFPVKKGLF GPTRYVKAVD GVSFTLERGE VLAVIGESGS GKTTLGRTVL 
RLIKPTGGKI IFEEKDITNT PESQLRWYRF STAMVFQDPF SSLNPYHTVQ YILEEPLILR 
GVPPEERHEL VVKALEEVRL TPPEDFLKKY PHMLSGGQRQ RIGIARALIT RPKFVVADEP 
VSMLDVSIRA EILSLMRSLQ EKYGITMIYI THDIATAKYL SDKILVMYAG KMVEYGPFRD 
VIKEPLHPYT QALIEALPDP DPTNRFRTRR VPPGEPPSLI NPPPGCRFHP RCPYAIKGKC 
EKEEPPFIEA KKGHYVACWL Y