Gene Pars_1575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1575
Symbol
ID	5055115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1425092
End bp	1426228
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	57%
IMG OID	640469116
Product	major facilitator transporter
Protein accession	YP_001153781
Protein GI	145591779
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000000000133383
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAGCACAT CAAAGCCTAA GCTCCTCGCC TACGCGCTCT TCTCAGCCCC GTACTCATTC 
GTCGTATTCC TGTTACCTTT CTATGTGTTT GAGGTAGGAG GCGACAAAGC CGCGGTCGGC 
ATATCCTTTG CCATGTACGC CCTAGCCATT GTCGTGTTCC GTCCCGCCGC CGGCTGGCTT 
GCAGACGTAG TGGGTAGACG TGTAACGAAC ATAGCCGGGG GCGTGGCGCT TGCCGTGGCC 
ATGGCCATTT TGGGCATATC AACGGAGTTG TCGCACATAT ACACAGCCTT GTTTCTAGCA 
GGGGTGGGAT CTAGTCTAAT AAACGTAGCG ATGATAGCCT ACGTGTCAGA CGTAGGGGGC 
TTAGAAAATC CCACACTGTA CTCAAAAATG AGGATTGCCG CCGCCTTAGG AGCCGTTGGC 
GGAGGGTTCT CGATCCCTGC CGCCTATGTC TTATCTAAGG CTTGGGGATA CGCTGCGGCA 
TTCAAAGCGT TGGCCGTAGC GATGTCGCTT ACAACAGTTG TCGCTCTCGC TCTCGTCCCC 
GAGGAGACAG CCCGCCTCGC GTTGCGCCAC AAATCAGGAG ATGTGGCGGC GGCGTTCTGC 
ATAACGGCGA TGGGGTTTTT CATAGGCGCC GCCACGGGGG TGTACGGCCC CCAGATCCTG 
CCCTATATCT ATGCCAAATT CTCCTTATCT CCCTTCGCCG CGGTGTTGGT ATACCTCCCG 
GCCGTTGTTG CATGGCTGAT AGGGCCAAAA CTGGCGAGGC CCACGGCGCT TTCCGCAATC 
ATAGGCGGTG CGTTAATGTC GGCGGCCCTC GTTGCGATGT ATCACTCGCC TAATCCTGCC 
CTATTTTCCG CCGTCTGGCT CGCGGAGAGC CTCGGCATCG CGATAGTGTC GACATCGCTG 
GACCAAGCGC TATCGAGGCA CGTAAAGGGA GCATACTGGG GGCGTGGATA CGGCGTATAT 
CAATCAGTTT ACAACATGGG CTATGCCTTG GGGGCGGCCG CATCAGGATT TCTGCCGAAT 
CCGTTCTACA CCGCCCTCCT ACCACTTGTT GCCTTCTTCG CACTAGCCGC TATATGCCAA 
GGTAGCCGAC GAATATCCCC AACGGGATCA CCAGCCCCAC GGCTAGGTTT AGGTTGA

Protein sequence

MSTSKPKLLA YALFSAPYSF VVFLLPFYVF EVGGDKAAVG ISFAMYALAI VVFRPAAGWL 
ADVVGRRVTN IAGGVALAVA MAILGISTEL SHIYTALFLA GVGSSLINVA MIAYVSDVGG 
LENPTLYSKM RIAAALGAVG GGFSIPAAYV LSKAWGYAAA FKALAVAMSL TTVVALALVP 
EETARLALRH KSGDVAAAFC ITAMGFFIGA ATGVYGPQIL PYIYAKFSLS PFAAVLVYLP 
AVVAWLIGPK LARPTALSAI IGGALMSAAL VAMYHSPNPA LFSAVWLAES LGIAIVSTSL 
DQALSRHVKG AYWGRGYGVY QSVYNMGYAL GAAASGFLPN PFYTALLPLV AFFALAAICQ 
GSRRISPTGS PAPRLGLG