Gene Pars_0283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0283
Symbol
ID	5054836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	251311
End bp	252717
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	57%
IMG OID	640467861
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001152548
Protein GI	145590546
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4986] ABC-type anion transport system, duplicated permease component
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGAACCC TATCTGCCCA GCATGGGGTC GCAGAGGCGG TAATACTCTC ACTCCTCGCT 
CTTTTGGCCA CGTTTGGGAG GATGGCTGTG GCTCTCTTAT TGACTGTGGC TGTGGCATAC 
GCCATTGGCT ACGCCATGTT CCGATCGAGG CGCGTCGAGA CCTTTATGCT TCCCCTTCTC 
GATGTTTTGC AGTCTGTGCC GATACTGGGC TTCTTCCCTC TAGCGCTTTA CTTCTTTATA 
GCGCTCCTCC CCGCGGCGGG TGCGGAGCTT GCAGCCATCT TCCTCATCTT CACGTCGATG 
GCTTGGAATA TAATCTTCAG CGTGTACCAG AGCTTCAAGA CGTTGCCAAG GGAGTTGCTC 
GACATGTCCC GGGTATACCT CAACGAGCGG CTTGCGCTGG CCCATGTCTT CATACCGGCG 
GCTCTACGGG GGGTGTACTA CAACATACCC ATATCGTGGG CGAATGCCTT CTTTTTCATA 
ACGGCGTCCG AGGTCATAAC ACTGGGCACA GAGATTAAGC TGTTCGGCAT TGGGAGCCTA 
GTGGTGAAGT GGTTTGACGA AGGGGATGTA TCATCCGCTC TTGTGGGTAT AGCGGTGGGC 
ATTGCGGCCA ACGTCGTTCT CTACCTGACG CTGTGGAGGA GGCTCATGAG CCAAGTGCCG 
CAACCGCCGG ACAAGCTGGC CGAGGCCGCG GGCCCGTGGC TTAAATACGG CGGCTACTTC 
CTCGCGGCAT TTGCCATAAT CTTGCTCGGG TTCGTCCTAT ATACGGCGCT CGGGAGCACC 
AACGCTGTTT TGGCAATTTC TAGGCTACCT GGGAGCTTCG TAGAGGCTTT GGCCGCGGCG 
CCTTTTACAC TTGTGAGGGT ATTGGCGACG TTGGCCATAA GCGCGTTGGT GGCTCTTCTT 
ACGTTACACG CCGTGGTTAG GGCCCCGCGT TTGGAGGCAG GGGTTCTTCT CGGCGTGTTG 
CTGATCTCAT CGGTGCCCGC TGTGTTTTTA TACCCGCTAC TCGGCGCATT AGTGAGGGGG 
GAGGCTCTGT CCGTGACGTT GCTGTTGCCA GGCGCTGTGG TCTATACCGT GCTGAACGCC 
GTGGCTGCTT GGCGAGATGT GCCTCAAGAC CTGGTTAAGG CCTATCAAAT CCGCGGCAGG 
CTCTACTTAA CCCAGGTGCT GATACCGGCA TCGATGCCGT ATCTGATAAC AGGGCTACTC 
ACCGCCTGGG GCGGCGCGTG GAACGCCTCA ATTGTGGCTG AGCCTCTTGC CAACGTCCAC 
GGTCTGGGGG GCTTAACGAC ACAAGCCGCC GACCGCGGCG ACATTTCTCT CCTAGTGGCC 
ACAGTAGCGA CTATGACCCT AATCGTAGTG GCCGTGAATA GGGTGGTGTG GAGAAGGCTA 
TACGAAGAGG CGGCAAAATG GCGCTGA

Protein sequence

MRTLSAQHGV AEAVILSLLA LLATFGRMAV ALLLTVAVAY AIGYAMFRSR RVETFMLPLL 
DVLQSVPILG FFPLALYFFI ALLPAAGAEL AAIFLIFTSM AWNIIFSVYQ SFKTLPRELL 
DMSRVYLNER LALAHVFIPA ALRGVYYNIP ISWANAFFFI TASEVITLGT EIKLFGIGSL 
VVKWFDEGDV SSALVGIAVG IAANVVLYLT LWRRLMSQVP QPPDKLAEAA GPWLKYGGYF 
LAAFAIILLG FVLYTALGST NAVLAISRLP GSFVEALAAA PFTLVRVLAT LAISALVALL 
TLHAVVRAPR LEAGVLLGVL LISSVPAVFL YPLLGALVRG EALSVTLLLP GAVVYTVLNA 
VAAWRDVPQD LVKAYQIRGR LYLTQVLIPA SMPYLITGLL TAWGGAWNAS IVAEPLANVH 
GLGGLTTQAA DRGDISLLVA TVATMTLIVV AVNRVVWRRL YEEAAKWR