Gene Pars_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1490
Symbol
ID	5056285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1348157
End bp	1349353
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	55%
IMG OID	640469032
Product	major facilitator transporter
Protein accession	YP_001153699
Protein GI	145591697
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.613246
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTATCT CCGCGTGGCT CGGGGGCAAT GTCGGCGCGA TGATCGTCTC GTGGTTCCTA 
TTTGCCATAT CAGGGTCGTT GACAACGCCT TACCTCTCCA AGTATCTACA ACTACTCGGC 
GCCTCGGAGG TTGAGATAGG GGTTGTCAGG GCGCTTAGCT CCTTAGCCGT AATGCTTACA 
ATCCTGCCAG GCGGTGTTCT CACAGACGTG ATTGGGAGGA AGAGGTCGAT CATTGTGGGC 
ACTTGGGGGA TAGCGGTAGT GCAGTTCCTA TACGCCGTGG TGACAGACTG GAGACAGTTC 
GCCGTGGTCT ACGTGGTGGA CTGGGCTCTC CACTTCTACC AACCGGCTCT TACCGCAATA 
CTGCTCGACT CTCTCCCGCC TGAGAAGAGG GGGGCTGGCA TGATGCTCAC TTCTGTTCTG 
CCACAAGTGC CGTGGCTTAT TCTGCCGCCA GTTGGGGGCT ACCTCCTAGA CCACTTTGGT 
CTCTGGGGGA TGCGCCTATC TTTCATAATA TCTGGGATAA TCTCGGTCAC AGTAGCTGTG 
TTGCGTATGA AGGCGCTTCA AGAGACTATT TCCGTGAAGC CGGTTCCGAG AGAGCAGTTG 
GTCAGGGAAA TTCTCGGCGC CTATATGTTC TGGCGCGGTC TGAATGGGAT GCCGAGGTTT 
GTGCTTTATG TGACTCTTCT CGGAGCTGTG CAGTCCTTCT CCTCTGTGGC GATGCAGACA 
TTTGGCGTGT TGTACGCCAC CACGGCAGTA GGCGTTGACA ACACCGCATG GGGTATTATA 
CAGAGCGCCG CAACTGCCGT AGGCATCGTA TTCGGCCTTG TGCTGACGCC TGTCATAGAC 
AAGGCCCCCA GGACCACGGC TCTTTTCTCA GGGCTCTTGT TAATAGCAGT AGGCTACTTT 
CTTGTAAGCG CCTGGGCTAG CGCAGTCGCA TTGACTACAG CAGCCATAAT TCTCGGCATA 
GGTGCAGAGG TGGCCATGTC AATACGAAGA GCAATTGTCG GCGACTACAT AACGCCTGAG 
AATAGGGGAA GAGTAATGGG CCTGACCCTG GCTCTTGAAT ATATAGGCTC AATACTTGGC 
GGAGTGATAG TCGGCTACGT CTACTCGGTC TCTCCCCGTC TCTCCTTTGC CGTTTCGGGC 
TTTTTAATAG CGCTGTGGGC TGCGCCGCTG GTAAAGACGG TGCTAAGAGG GTTGTGA

Protein sequence

MGISAWLGGN VGAMIVSWFL FAISGSLTTP YLSKYLQLLG ASEVEIGVVR ALSSLAVMLT 
ILPGGVLTDV IGRKRSIIVG TWGIAVVQFL YAVVTDWRQF AVVYVVDWAL HFYQPALTAI 
LLDSLPPEKR GAGMMLTSVL PQVPWLILPP VGGYLLDHFG LWGMRLSFII SGIISVTVAV 
LRMKALQETI SVKPVPREQL VREILGAYMF WRGLNGMPRF VLYVTLLGAV QSFSSVAMQT 
FGVLYATTAV GVDNTAWGII QSAATAVGIV FGLVLTPVID KAPRTTALFS GLLLIAVGYF 
LVSAWASAVA LTTAAIILGI GAEVAMSIRR AIVGDYITPE NRGRVMGLTL ALEYIGSILG 
GVIVGYVYSV SPRLSFAVSG FLIALWAAPL VKTVLRGL