Gene Pars_0200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0200
Symbol
ID	5055943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	179822
End bp	181039
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	59%
IMG OID	640467779
Product	major facilitator transporter
Protein accession	YP_001152467
Protein GI	145590465
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.661715
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTCG CCGCTAGCTA TGTTCCCATT TTAGTTGCCC GTATTGGGTC GGGGGCCTCT 
GCGTTTCTGG TAGTCAAGCT GGCAAGCGGG GGCGCCGTGG AGGCGGGCTT CGTCCTCGCC 
GCCTATCCGT TTCTAGAGGC GCTGGGAGCC TTCGTGGCGG GTCGTTGGTC GGATACCCTG 
GGCAGAAAAA CAACGCTGAT TATGGGCTAC GTGGTGAGGT CGATTGCGAT GTTGGCTCTG 
GCGTGGGCTT TCTACACGCA TGAAGCCCCG TGGCTGGAGG CGTTTCTAAA CGGGGTAATA 
GGCTTCACCA CCGCGTTTAT CCTCACGTCG TCGCTCGCAA TGGCCACAGA CCTCACAGAG 
GTGAGAAATA GGGGGCTGGG TATGGGAGGT TTTGAGTTCA TAAACCTGGG GAGCTACGGC 
GTGGGCTACC TCTTGGGCTC TGCCTTGTAC TCCATTTTTC AGGACCCATC AGCGTATTTA 
GCGGTGGCGT TGTTCACCAC AGTTGCTATT CCAGTATTCG CAAAGTACAT AGAGGAGACG 
AGACCAGCGG CGCCTGGGGA GGGGAGGCTC TTGCTCTCGG TACTGCCGCC TTCGGCGGTG 
GCTCTTCTCC CCGTGTGGTT TGCCTTAACA ACGATAATAG GGCTTGCGAT GTATTCGCCA 
AGAATTTTAA GAATAGAAGG GGGCAACCTC GGCGTGGCGG GGCACATCGT GCAGATGCTC 
GGCGGTCACC TGGCAATCGG CCTCTTGTTT ATCAGTGCCT TGGCTTTGCT GGGGCTGGGC 
GCAATATTCT TCGGTAGGCT GGCCGACAGG TGGGGGCGGC TGAAGACCTT TAGGCTGGGG 
CTGATAGGCG GCCTCCTCGC CCTTGTAACG CTAAACGTTG CGCTACGCCT CAGCCTAGGC 
GTCGTTGAGG CAGTCGCAAT CACGGCCCCC CTGCTGTTCC TAACCTCGGC TATTGGACCC 
TCGATCTTGG CCATGATCGG CGACGAGGCC GATATAAGGT ATAGGGGGAC TGTCATGGGG 
ATATACAGCG TTATGCTAGG GCTTGGGATC GGCTTCGGAA GCCTTCTAGG GGGCTTCGTG 
GCCGCCGCGT TTCCGCAATA TGAAATAAAC GGGCTAGCCG CCGCGGCGCT CGGCGTATAC 
GCCACAATGG CGGCGCTCCA CTTGGTCGTA GCTAACACAT CCGCCGGGAA GAGGGGGCTA 
GCGCTAGAGA AGGGGTAG

Protein sequence

MRLAASYVPI LVARIGSGAS AFLVVKLASG GAVEAGFVLA AYPFLEALGA FVAGRWSDTL 
GRKTTLIMGY VVRSIAMLAL AWAFYTHEAP WLEAFLNGVI GFTTAFILTS SLAMATDLTE 
VRNRGLGMGG FEFINLGSYG VGYLLGSALY SIFQDPSAYL AVALFTTVAI PVFAKYIEET 
RPAAPGEGRL LLSVLPPSAV ALLPVWFALT TIIGLAMYSP RILRIEGGNL GVAGHIVQML 
GGHLAIGLLF ISALALLGLG AIFFGRLADR WGRLKTFRLG LIGGLLALVT LNVALRLSLG 
VVEAVAITAP LLFLTSAIGP SILAMIGDEA DIRYRGTVMG IYSVMLGLGI GFGSLLGGFV 
AAAFPQYEIN GLAAAALGVY ATMAALHLVV ANTSAGKRGL ALEKG