Gene Mpal_1052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1052
Symbol
ID	7271786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1081710
End bp	1083200
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	52%
IMG OID	643569688
Product	drug resistance transporter, EmrB/QacA subfamily
Protein accession	YP_002466122
Protein GI	219851690
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.923754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.334038
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGTA CCAGTCAGGG AACGGATCAG AAAGGATTGA ACCTTCTGAT CCTCTCCATC 
TCCCTCGCAA CGTTCATGTC GTCACTGGAC GGAACGATCG TCAATATCGC CCTGCCGACC 
ATCTCTTCGG TGTTCAATAT CTCTTCGAGT ACCGTGAGTT GGGTTGCGAC CATTTACCTG 
CTGGTGATGG CTGGCTGCGT CCTGATCTTC GGTAAGTTGT CGGACAGTGT CGGGTTTAAA 
AGAATGTTCC TATCAGGATT TGTAATCTTT ACCCTGGGAT CGTTCTTATG CGGTCTGCTC 
CCGGACCTCC TATCTTCATT CTTCGCGCTC ATCGGTTCAC GTGCATTCCA GGCAATAGGC 
GGTGCCATGA TAACAGCGAT TGCGCCGGCG ATGATCGCTG CATACATCCC CATGAAGCAG 
AAAGGAAAAG CGATGGGAAT CGTTATGACC GTCGCTGCAC TCGGGACCGC CATCGGACCG 
ACCATCGGTG GAGTCCTCAC CCAGTACATC TCCTGGCACT GGATATTTTT CATCAACGTA 
CCGGTGGGAA TCTGTGCAAT CATACTGGGG TTACGTGTTA TTCCCACCAC TCAGCCCCAC 
AATAAAAATG CCGGCTTTGA CAGAGCCGGC GCGTTGTTGA TCTTCACCGG CCTCGCTGCA 
CTGCTCTTTG CGGTTTCAGA AGGGCAGTCG CTTGGGTGGG ATTCCCCGGT GATCCTCGGT 
TCCCTTGCCC TCGCTCTCAT TACACTCGGT TACTTTGTAT GGCACGAACT CAGGACCGCT 
GACCCTCTGC TGGAACTCCG TCTCTTTAAA AACAAGAACT TCCTGATGAC CAATCTTGTC 
CTTTCGCTGG TCTTCTTCAG TTTTGCCGGT ATCAGTTACC TGCTCCCGTT CTATCTTCAG 
TACATCAAAG GGTTCAGTTC CTCAGATGCA GGGATGATAA TTACCGCCCT ATCGGTTGCC 
ATGATGGTCT CCGGCCTTCT TTCAGGAGCG CTGTATAACC GGGTTGGTGG CAGGATACTC 
TGCATCGCTT CGGGGATCTT CCTGGTTGCC GGTTATTTTA TGATGACCCT CCTCCGGGTC 
GACACCTCAA TCGGATTTGT GATTCTCTGT CTGCTCGTGC TCGGTTTCAG CCTTGGCCTG 
ATGATCACAC CGGCATCGAA TATGATCATG AACTCGGTTG CTAAGCGATA CCAGGGGATG 
GTCTCCAGCC TCACGAGCCT TGAACGATTC GCACCGTTGA CCCTGGGGAT TGCTTTTGCA 
AACCTGGTCT TTATTCAGGG GATCACAGCA ATTGCTGACA ACCGGGGGAT CACGGAGAGC 
GCACCGGTTA ACATCAAACT GCACCTGATT ACTGCTGGTT TTGACCTTGC CTTCTTCTTC 
TCACTGGTTA TTGCGGTCAT CATCCTCATC CTCACCCTGC TCGCACGACA GGAAGTGCAC 
CCGGACTACC AGTCAGGCAC CGATGAGGAT GCTCTGAATA GTACAATCTA A

Protein sequence

MESTSQGTDQ KGLNLLILSI SLATFMSSLD GTIVNIALPT ISSVFNISSS TVSWVATIYL 
LVMAGCVLIF GKLSDSVGFK RMFLSGFVIF TLGSFLCGLL PDLLSSFFAL IGSRAFQAIG 
GAMITAIAPA MIAAYIPMKQ KGKAMGIVMT VAALGTAIGP TIGGVLTQYI SWHWIFFINV 
PVGICAIILG LRVIPTTQPH NKNAGFDRAG ALLIFTGLAA LLFAVSEGQS LGWDSPVILG 
SLALALITLG YFVWHELRTA DPLLELRLFK NKNFLMTNLV LSLVFFSFAG ISYLLPFYLQ 
YIKGFSSSDA GMIITALSVA MMVSGLLSGA LYNRVGGRIL CIASGIFLVA GYFMMTLLRV 
DTSIGFVILC LLVLGFSLGL MITPASNMIM NSVAKRYQGM VSSLTSLERF APLTLGIAFA 
NLVFIQGITA IADNRGITES APVNIKLHLI TAGFDLAFFF SLVIAVIILI LTLLARQEVH 
PDYQSGTDED ALNSTI