Gene Pars_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1251
Symbol
ID	5055489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1130462
End bp	1131730
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	60%
IMG OID	640468794
Product	major facilitator transporter
Protein accession	YP_001153467
Protein GI	145591465
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0968424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.933487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATTA GGACGGTTGT CGCGGCCTCG ACTATCGGGA CCCTTATTGA GTGGTATGAT 
TTTTTTGCGT ACTCATCTCT CTCCCCCTTC ATAGCCGAGT ACTTTTTCCC CAAGAGTGAC 
CCGGCGGTTG CCATAATTTT GACGTGGCTT GTATTCGCCA CCGCCTTTGT GGTGAGGCCA 
GTCGGCGCCG TCTTGTTCGG CCATCTGGGA GATAGGATAG GGCGTAAGTC CACCTTCCTC 
ATAACGCTGA TAGTCATGGG CCTAGCCACC TTTTTCATGG GCCTAATCCC CACGTACGCC 
CAGGCAGGCA TCGTTGCTCC TCTGCTACTG ACATTGCTGA GGATAGTACA GGGCATCGCG 
CTGGGGGGCG AGTACGGCGG CGCCATCACA TACGTCTTGG AGCACGCCCC GGCGGGTAGG 
AGGGCTTTTT ACAACGGGTT CGTAGCCGCC ACTCCGCCCC TCGGGCTGGG CCTCTCATCC 
ATCACCGTGG TGTTGTCCTC GTTGCTCTTG ACAAAGGAGC AATTCGCTAC CTGGGGCTGG 
AGGATGCCGT TCCTCGTCTC CATTATCCTC ACGGCGCTTG GGGTATACCT GCGCTTCAAG 
CTTGCAGAGT CCCCCGTTTT TGAGGACATC AAAAAGAGGG GCGAGGTAGC CAGAGTACCC 
ATCGCCGAGG TGCTGGGGAG GCACCTACCG TGGGTGCTGG TGGGGGTGGC GGTGGCCGCT 
GGCCACGCGG TGTTGGCCTA CACGTCGACT GGCTACATAT TTACCTACTT GGTGCAGACA 
GCTAAGCGGA CGCCTGTGGA GGCCAACATT ATAGTGGGCG CCGCGGCGCT GGCGCAAATA 
CCCTTGTACC TATTAGCCGC GTGGCTTGGC GATAGGGTTG GGAGGAAGGC CGTCTACATG 
ACGGGGCTGG CCATCGGCTT GGCAACCTAC TACCCCCTCT ACTACCTCCT GCCCTCCCTT 
GACCTTTGGC TCGCCGCATT GGCCGTCTAC GTCATGGTTG GGGCCACCGC CTTCACATTC 
GGCATCTTGG GCACGGCACT TGCGGAGCTC TTCCCCGCCA GGGTTAGGTA CAGCGGGATG 
TCGCTGGCCT TCAACCTCGG CGTGGGGCTG TTCGGCGGCT TCACCCCCAC TATCGTCCAG 
CTGATAGGCA CCCTCCTCAA AAACCCGCTT GCCGGGTTGT TGCTGTACAC ATACGTCGTG 
GCCGCCGCGG CTCTGATAAT CGCGGCGCTC ATCCTGCCCG AGACTAAGTC AAAAGACGTC 
GCCGCTTAG

Protein sequence

MSIRTVVAAS TIGTLIEWYD FFAYSSLSPF IAEYFFPKSD PAVAIILTWL VFATAFVVRP 
VGAVLFGHLG DRIGRKSTFL ITLIVMGLAT FFMGLIPTYA QAGIVAPLLL TLLRIVQGIA 
LGGEYGGAIT YVLEHAPAGR RAFYNGFVAA TPPLGLGLSS ITVVLSSLLL TKEQFATWGW 
RMPFLVSIIL TALGVYLRFK LAESPVFEDI KKRGEVARVP IAEVLGRHLP WVLVGVAVAA 
GHAVLAYTST GYIFTYLVQT AKRTPVEANI IVGAAALAQI PLYLLAAWLG DRVGRKAVYM 
TGLAIGLATY YPLYYLLPSL DLWLAALAVY VMVGATAFTF GILGTALAEL FPARVRYSGM 
SLAFNLGVGL FGGFTPTIVQ LIGTLLKNPL AGLLLYTYVV AAAALIIAAL ILPETKSKDV 
AA