Gene Paes_1578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1578
Symbol
ID	6460123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	1718727
End bp	1720043
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	51%
IMG OID	642725566
Product	major facilitator superfamily MFS_1
Protein accession	YP_002016243
Protein GI	194334383
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0877587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATA ATGCCTCCCC AAAGAGAATC GGGCCCATCG AGCTGGCACC GACCATACAT 
CGCAGCCATG CCTGGACGTT TTTCTATGCC GCATTTTTTT CCATCGGCTT CATCACCTTT 
CTCTCGATAG GCCAGACCTA CATTCTCAAT GTCCATCTCA ACATCCCGGT GTCTGAGCAG 
GGAGCAATCA GCGGCGACCT GGTCTTTCTG ACAGAACTGA TTACGCTGGT ATTTTTTATT 
CCTGCCGGCA TTCTCATGGA CCGTATAGGA AGAAAGCCTG TCTATGTGGC AGGGTTCCTG 
CTCATCGCCG CAACCTATAT CCTCTACCCT TTCGCTTCGT CAGTTAACGA TATGATGCTC 
TATCGCATCA TCTATGCTCT TGCCGTTGTT GCCATAGCCG GATCACTCTC GACAGTGCTT 
GTCGACTACC CCGCAGACCG GTCACGAGGC AAAATGGTAG CGATCGTCGG TCTCCTTAAC 
GGGCTTGGAA TTGTCATCAC CAACCAGTTT TTCGGATCCC TTCCCGAAAT GCTCACCATA 
AAAGGAGTCG ACGCAATCCA GGCAGGCTTT ATAACTCACT TCTCGATTGC GGCTCTGGCA 
GTCCTTGCGG CAGTCATCTG CGCCATCGGC CTGAAAAAGG GAACCCCTGT CACCGAAGAA 
GAACGCCCTG CGCTCAAAAC GCTTTTGCAA AGCGGACTCG TCGCAGCCAA AAATCCGCGA 
ATTATGCTCT CCTATACAGC TGCGTTTATT GCACGAGGCG ATCAGTCCAT CAACGGAACG 
TTCATCAGTC TCTGGGGAAT TACCGCTGGC CTGGCTATGG GTATGGAGTC CGGCGAAGCA 
TTCAGAAAAG GGACAACTAT TTTCATCATC ACTCAGGTAG CAGCACTGCT CTGGGCGCCT 
CTGATCGGCC CGGTCATTGA CCGTTTCAAC CGGGTCAGCG CACTCGGATT CTGCATGTTT 
CTGGCCATGA TCGGCAATCT GTCGGTTCTT GTGCTTGATC ACCCGTTTCA AAATATCGGC 
TATCTGGTCT TTATTCTCAT GGGAATCGGA CAGATCAGCG TTTTCCTCGG CGCCCAGTCA 
CTGATCGGTC AGGAAGCCCC TAAAGCGACA CGAGGTTCGG TAATCGGCGC ATTCAATATC 
AGTGGAGCTA TTGGGATTCT GCTTATCGCT TCGGTCGGCG GACGAATGTT TGACGGCATA 
AGCCCAAAAA CACCTTTTGT CATTGTAGGG ATTATCAATG CCTTACTGGT AGTCTACAGC 
ATCTATGTGC GCATCAAAGC TCCGCACAAG CTTGAAACAA GCCCTAAAAG CGCATGA

Protein sequence

MNNNASPKRI GPIELAPTIH RSHAWTFFYA AFFSIGFITF LSIGQTYILN VHLNIPVSEQ 
GAISGDLVFL TELITLVFFI PAGILMDRIG RKPVYVAGFL LIAATYILYP FASSVNDMML 
YRIIYALAVV AIAGSLSTVL VDYPADRSRG KMVAIVGLLN GLGIVITNQF FGSLPEMLTI 
KGVDAIQAGF ITHFSIAALA VLAAVICAIG LKKGTPVTEE ERPALKTLLQ SGLVAAKNPR 
IMLSYTAAFI ARGDQSINGT FISLWGITAG LAMGMESGEA FRKGTTIFII TQVAALLWAP 
LIGPVIDRFN RVSALGFCMF LAMIGNLSVL VLDHPFQNIG YLVFILMGIG QISVFLGAQS 
LIGQEAPKAT RGSVIGAFNI SGAIGILLIA SVGGRMFDGI SPKTPFVIVG IINALLVVYS 
IYVRIKAPHK LETSPKSA