Gene Pars_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2141
Symbol
ID	5056234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1917506
End bp	1918945
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	58%
IMG OID	640469693
Product	putative thiamine transport system permease protein
Protein accession	YP_001154339
Protein GI	145592337
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1178] ABC-type Fe3+ transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGAGG GAGGTCGCTT CAGGTTAACA GTATACCAGG CGCCGGCCCT CTTATACCTT 
TTTGTTTTTG GGGCGCCGTA CTTGTTTTTG TTGAGCCGCT ACGGATTCTC CTCTGGGCTA 
GACGAATATA CGTTGCGAGT TTTGTGGTTC ACTTTGTGGC AGGCGGCTCT CTCTGCGTTG 
TTGTCTCTGG TAGGGGGGTT TGCCCTCCTG CCAGCCTATC TCAAGACGCC CTGGGTTAAG 
CCCCTGGCCC TCATCCCCTT CTTTGCCCCG GCCCTATCCA CTGTAGACGC TCTTATTAGG 
CTCCACGGCG ACGTGATGTA CAGCCCGTGG GGAATTATCA TAGCCCACGG AGTCTACTAC 
GCCCCCTATG TGGCGTTGCT CCTAGAGTCT AACATGCTCT CTATGCCGGC AGATCTGACG 
GAGGCTCTGG ATCTATACGT CAGGCGGCTC AGGACTAGGC TGAAGATCGT GTTGTGGGAA 
CTAAGGCCCT CAATACTCTA CTCGCTCTAC ACAGTGTTCG TCTTCAGTTT CCTCAGCTTC 
ACCACGCCTC TCCTCCTCGG AGGGAGGTAC CCCACCCTGG AGCTTTTGAT ATACATATAC 
GCAACCTCCT ACGCCTCCAC TGCGCTGGCC TCTGCACTTG TGGCGCTTAA CTTGGTAGCC 
ACCTTGGCGC TGGCTGCACC GCTTTTCAGA ATGAGGAGCC CCCCTCCGGC GGATCCCGCC 
GCCAGGCCCC CCAAAATGGG GCTTCTGCCC ACGGCCGTGG GGCTGGCCGC AACCGGGTAC 
TACGCCGTAG CGGCTTTCTA CATCTTTTCG CCTTTGCTTG CGCCAAGGGG CGTCGCCGAG 
GTGTGGCCGT ACGTGTTGAA TAGCATCCTC GTAGCCGTGG TGGCGGCTAC TGGGTCGCTG 
GTCTTGGTCT TGCTGTTCCT CATGGCTGAT GGGGCGGGGT CCAGGTTGCC TGGCGTTGCC 
TACGCCGTGG CGCTTTCTCT TTCTAAAAGC GTCTTCGCAT TGGGCTTTTT CTACCTGGCT 
CAGCCTCTCT ACGGCACCCT TCTCATCCTC GCCGCGGCGC ATATGCTGGT GATCTCCCCC 
CTGGCCTTCT CCCTTGCTAA GCCGGCTTGG GATAAAATAA GACAAGACGT GAGGGAGTCG 
TGCACCTTGT ACCTCGGACC AGCGAAGTGC GTTATTAGAA TAGTTGCGGA GCTCCTGGGC 
CCCACCATTG TCCAGGCTTG GCTGATAGCT CTCGCCTCGT CTCTGTCCGA GACTACTCTG 
GCCCTTATGC TCACCACAGG GGCGTCTACG ACTCTTTCCG CAATGACGGC GCACCTCCTC 
ACGTCAAGAG GGCCCGAACT GGTTGAAACT GGGCACTTCT ACTCGTCACT TCTCGCATTG 
CTGGTTCTAG TCACCGTGGC CCTGTCACGT CTCGTAAAGA CGAGGCCCTT CTCCTTCTAG

Protein sequence

MAEGGRFRLT VYQAPALLYL FVFGAPYLFL LSRYGFSSGL DEYTLRVLWF TLWQAALSAL 
LSLVGGFALL PAYLKTPWVK PLALIPFFAP ALSTVDALIR LHGDVMYSPW GIIIAHGVYY 
APYVALLLES NMLSMPADLT EALDLYVRRL RTRLKIVLWE LRPSILYSLY TVFVFSFLSF 
TTPLLLGGRY PTLELLIYIY ATSYASTALA SALVALNLVA TLALAAPLFR MRSPPPADPA 
ARPPKMGLLP TAVGLAATGY YAVAAFYIFS PLLAPRGVAE VWPYVLNSIL VAVVAATGSL 
VLVLLFLMAD GAGSRLPGVA YAVALSLSKS VFALGFFYLA QPLYGTLLIL AAAHMLVISP 
LAFSLAKPAW DKIRQDVRES CTLYLGPAKC VIRIVAELLG PTIVQAWLIA LASSLSETTL 
ALMLTTGAST TLSAMTAHLL TSRGPELVET GHFYSSLLAL LVLVTVALSR LVKTRPFSF