Gene Pars_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0213
Symbol
ID	5056368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	192405
End bp	193544
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	59%
IMG OID	640467792
Product	putative ABC-2 type transport system permease protein
Protein accession	YP_001152480
Protein GI	145590478
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG1668] ABC-type Na+ efflux pump, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.331802
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.747646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGCAT TCACGGCACT GGTGGTGAAG GACCTCCAGG AGATTTTGAC ATCTCGCTAC 
TTCTTGGCTT CTCTTCTAGG CGGTTTTGTA GTCTTAATAG CGCTGGGCGC CGTGATGGGG 
GCGTCGATAG AAACTGCCCA GAAGGCTACT CAGAGTTTTG CAGTGGTGGT GGGGAACACC 
ACAGAGCTGG GCCAGAGGTA CGTGGAGCTG TTAAGGGAGC TCGGCGGTGT TTTGTACGAG 
AAGTTCTCCC CCGACTTGCT TGACAGGTAC AGCTACGCCG TCGTGGTGCC GCCTAATTTC 
ACACTGCCGG CAAAGGTGGA GGTGTATGCA AAATACAGGG GGTTGTTGTC CACGGCGACG 
CCTCTCTTCG TGGAGCTGGC CGCGCAGAGG CTTGCCGAAG AGGTGGGCGT GCCGCCGCAG 
CCTATCAACA CGGAGCTCTA CGTATACCTC GGCGATCGCG TGTTAAAGGC TGGGGAGGTG 
GCGATGCTGG CAAATCTCTT CCTCATATCT TGGATGTTTA TGTTCCTGGT GCCTCTGCTA 
GTCGCCTCCA CGGCGGCGGT TGCGGTGGGG CTTGAGAAGG AGAAGAGGAC GTTTGAGCTT 
ATCCTCTCGA CGCCGGCTAC TGCGAGGACG CTCGTCGCGG CGAAGCTCAC AAGCGCCGTG 
GCGCTGGCGT TTATACAATT CGCCGTGATG GCCGTGGCGT TTATCTTCTA CTTCTACAAC 
CTTTCCAGAG CCGCACCCCC CGTGCTTTCC GGCGAAGTTG CGGGGGAGGC AGTAGCTCCG 
TCGCCCGCGT TGTTTGTCCC GGTGGCTTTG TCCACGCTGG CCTTGTCCTT GGCGCTACTG 
GGACTCGCGT TTATAGCCGC GACCAGAGTC GAGGATATAA AGACGGCGCA GAGCGTCGTA 
CCCATGGTTG TGTTCCCCCT CCTCGTGCCG TCCTTCGCCG CGATCTTCGG CACAGTGGAA 
GGCCTTGAGG CCTACCCCTT CGTCCACCCA CTGGCTGTGG CATATTCGGC GCTGGTTGGG 
CAGTGGGATA AGGCCTACGC CTTTCTCGCA ACTGATTGGG CCTTGGCCAT CGCCGTCGTC 
GCATCTATAC TCAAATTCGT CACCACGGAC TACCTCATAA CTGGGAGGTG GAGGCGATGA

Protein sequence

MGAFTALVVK DLQEILTSRY FLASLLGGFV VLIALGAVMG ASIETAQKAT QSFAVVVGNT 
TELGQRYVEL LRELGGVLYE KFSPDLLDRY SYAVVVPPNF TLPAKVEVYA KYRGLLSTAT 
PLFVELAAQR LAEEVGVPPQ PINTELYVYL GDRVLKAGEV AMLANLFLIS WMFMFLVPLL 
VASTAAVAVG LEKEKRTFEL ILSTPATART LVAAKLTSAV ALAFIQFAVM AVAFIFYFYN 
LSRAAPPVLS GEVAGEAVAP SPALFVPVAL STLALSLALL GLAFIAATRV EDIKTAQSVV 
PMVVFPLLVP SFAAIFGTVE GLEAYPFVHP LAVAYSALVG QWDKAYAFLA TDWALAIAVV 
ASILKFVTTD YLITGRWRR