Gene Pars_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1105
Symbol
ID	5056129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	990554
End bp	991513
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	56%
IMG OID	640468661
Product	ABC transporter related
Protein accession	YP_001153335
Protein GI	145591333
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.788183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.492293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGTGT TGAGGGGGGT TGTAAAGTCG TTTAGGGGCT TTACGCTCCA CGTAGAAGAG 
CTGTCGGTGC CCGACAAGAC GTATGCTGTA ATTTTAGGAC CGTCGGGGTC TGGGAAGACT 
ACGCTACTGC GCATCATCGC CGGTCTCGAA AGGCCCGACA GGGGCTCCAT CCTGCTGGAC 
GGCCGGGATA TCACTCACCT ACCTGTCTGG GAGAGGGATG TGGGTATAGT GTTCCAGAAC 
TACGCGCTGT ATCCCCACCT CACAGTGTTT GAAAATATCG CCATGCCTCT TAGAAATAAG 
AAGTTACCAA GAGACGAGAT TAAGAAGAGG GTAGAGCAGA TTGCCGAAGT GCTGGGCATA 
AAGGACCAGC TCCACAAATA CCCCCACCAG CTGTCTGGCG GGCAACAGCA GAGGGTGGCT 
ATTGCCAGGG CGTTGGTCAA GGAGCCGAAG GTCCTCCTGC TCGACGAGCC GCTGAGTAAT 
TTAGACGCCC GGCTGAGGCT AGAGGTGAGG GGGTTCCTAA AAGAACTTCA GCGGAAGGTC 
GGCGCCATTG TGGTCCACGT GACTCACGAC CAGGAGGAGG CCATGGCGCT GGGCGACTTA 
ATGGTCGTCA TGAACAACGG CAAGGTTGAG CAGGTGGGGA CACCGCACGA GCTGTATAGG 
AAGCCGAGGA ACCTCTTCGT GTTTAACTTC CTCGGCCTCG GCAACCTAGT GCCTGCTAAG 
GCGCTTGGCC TAGGCGGCCA ACACCTGCTT GGGTTTAGGC CAGAGGACGT GGTCCTGGGC 
TCCGGGGACT ACGTGGCGAG GGTCGTGAGG CAGGAGTATC TAGGCCCCTA CAAGCTTGTG 
GAACTTGAGT ACAACGGCTT TAGGATTAAG GCGAGGGCCC CTCCCACTGC TGAGTTTAGG 
GAGGGCGAGG CGGTGAGGTT CGGTATAGAT ATAGAAAAAG CCCTAGTTTT TCGGGAGTGA

Protein sequence

MLVLRGVVKS FRGFTLHVEE LSVPDKTYAV ILGPSGSGKT TLLRIIAGLE RPDRGSILLD 
GRDITHLPVW ERDVGIVFQN YALYPHLTVF ENIAMPLRNK KLPRDEIKKR VEQIAEVLGI 
KDQLHKYPHQ LSGGQQQRVA IARALVKEPK VLLLDEPLSN LDARLRLEVR GFLKELQRKV 
GAIVVHVTHD QEEAMALGDL MVVMNNGKVE QVGTPHELYR KPRNLFVFNF LGLGNLVPAK 
ALGLGGQHLL GFRPEDVVLG SGDYVARVVR QEYLGPYKLV ELEYNGFRIK ARAPPTAEFR 
EGEAVRFGID IEKALVFRE