Gene Pars_1524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1524
Symbol
ID	5054083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1383374
End bp	1384438
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	60%
IMG OID	640469065
Product	major facilitator transporter
Protein accession	YP_001153730
Protein GI	145591728
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.38221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATAAACC TAGCAACTCT TCTTTTTTTC ACAGCCAACG GAATCGCCGT AGTGGCAATA 
CCGCCGTATT TAAGAGACCT CGGCGTGAGG AGCGAGTCGG TAATAGGCGC CATTGTGTCA 
ACGGCGTTTT TCGTGTCAAT AATAATGCGG CCCGTCAGCG GGGTGCTAGG CGACAGGATA 
GGCTACATAA CCCTCATGAG GGCAGGAGTG GCCTCGGCGG TGGCCGCCCA GGCCATGTAC 
CTAGTGGGCG ACCCGTTTTG GGTACAAGTG GGGAGGCTAT TCCACGGCCT CGCAATAGCC 
ACCTTCCTCC CAATGTCAGT AGCCGCCTCA GTTGCCGAGG GCCCCAAGGC GATGGCCGCC 
CGGTCTCTGG CAGTGGGCGT GGGCAACGTC CTTGGCCCCC TCCTCGGTAG CGCTTTATAC 
GACATAGGAG GCGCGCGCCT CTCCTTCATC ACAGCCCTCG GGCTCCACGC CTCCAACTTT 
GCCCTGGTAA GAGGCGGCGA CAAGACGCGT AGCCCCGGAG AGCCGGGCAC GGGCATAGAG 
AGGCGGGTAT TCCTATTCAT GGCACTACTA TCGCTCTACG GCGCCGCTTA TATGGGCATC 
TCCACCTTCA TCCCAGTAAA ACTCAGAGAC AACAACCTCC CCATAGCCTA CTGGGGCCTC 
TTCTCATCCT CCGCCGCCTT GGTGAGCCTC TTGCCTAGGG CTTTCCTATT GAAGAAAGGC 
CTCGTGACGC CAACAACCGC CGGAGCCGCC ACGGCGGTTG CGGCCCTGGG GATGGCCGCA 
GCGACCTTTG CAGATGGGCC ACTCCTCTTC GTAGCCGCCG GGGCCATATA CGGCCTGGGA 
CAAGGCGCCG TGGTTGTCAC ATACCAGATA CTGGCACTAG CCGGGAGCAA GAGGGCGGGG 
GTAAGCAGCT CTGTGTACAC AATGGGCTGG GACGTCGGAT CCATAATAGG CCCCGTCCTC 
GGCGGCTGGC TCGTGGAGAA CTTCGGCCTA GCCGCGTTGC ACTACACCCC CCTCCTCCTG 
GCGGCGAACG TCGCAGTGCT GTTTTTATAC GCAAGACGTA AGTAA

Protein sequence

MINLATLLFF TANGIAVVAI PPYLRDLGVR SESVIGAIVS TAFFVSIIMR PVSGVLGDRI 
GYITLMRAGV ASAVAAQAMY LVGDPFWVQV GRLFHGLAIA TFLPMSVAAS VAEGPKAMAA 
RSLAVGVGNV LGPLLGSALY DIGGARLSFI TALGLHASNF ALVRGGDKTR SPGEPGTGIE 
RRVFLFMALL SLYGAAYMGI STFIPVKLRD NNLPIAYWGL FSSSAALVSL LPRAFLLKKG 
LVTPTTAGAA TAVAALGMAA ATFADGPLLF VAAGAIYGLG QGAVVVTYQI LALAGSKRAG 
VSSSVYTMGW DVGSIIGPVL GGWLVENFGL AALHYTPLLL AANVAVLFLY ARRK