Gene Mpal_1478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1478
Symbol
ID	7270083
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1527891
End bp	1529090
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	51%
IMG OID	643570101
Product	major facilitator superfamily MFS_1
Protein accession	YP_002466523
Protein GI	219852091
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.311538
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAATT GGAAGAGAAA CTTAATCGTC TGCTGGTTCG GGATGTTCAT GACCGGTATG 
GGGCTGAGCC AGATCGCACC GGTATTGCCG CTGTACATCC AGCATCTCGG CGTCGACAAC 
ACCGCGTTGA TCGAACAATT TTCTGGCATA GCATTTGGTG TAACATTTAT CATTTCAGCG 
ATCTTCTCAC CGATCTGGGG TCTTGCCGCC GACAAATTCG GACGAAAATC GATGCTGTTA 
CGAGCAAGTC TCGGCATGGC GATCGTGATC GGGTGCATGG GGTTTGCACA GAACGTGTAC 
CAGCTGATCG GACTGCGGCT ATTGCAGGGC GTGATAACCG GGTACAGTTC GGCCTGTACT 
GCATTGATTG CAACGCAGAC GGACAGAGAA CACGCGGGCT GGGCGTTGGG TACCCTTTCG 
ACATCTTCGA TCGCAGGAAC TCTGCTCGGA CCCATGATTG GCGGGTACAT CGCAGAGAAC 
CTGGGTTTTC AGGAGGTTTT TTTTATAACC GGTGCACTGC TGCTGATCGC ATTTATTGCA 
ACCGCCCTCT TTGTGAACGA ATCATTCACC CGTCAGGACA GGATGGTGCT CAGTATCAAA 
GAGACCTGGG GGACTGTTCC ACACAAAAGT TTGACACTTA TTCTGTTTGT GAGCTCTTTT 
GTCATGACTC TGGCACTATA CTCCGTGCAG CCCATCTTGA CCATATATAT TACCCAGTTA 
TCCAGTACCA CCAGTCATGT TGCTCTGCTG GCAGGTATGA CATTCTCGGC CTCAGGGCTG 
GCCAGTATCG TTGCGGCTTC ACAATTGGGG AAACTCTCTG ATAAGATTGG CCCCCAGAAG 
GTCATGCTTG CCGCACTGAT TGTAGCCGGA CTCATCTTTA TCCCCCAGGC CTTTGTAACC 
GACCCCTGGC AGTTGATGGC CCTTCGATTT GTACTGGGAT TGGCGATCGC GGGATTGATT 
CCGTCTGTCA ATACCCTGCT CAAGAGGATC ACACCGGATT CTCTGACCGG CAGGGTCTTC 
GGTTTCAACA TGTCTGCAGG GTATCTGGGT GTATTTGGAG GATCAGTCCT GGGCGGGCAG 
GTGGCAGCCT ATCTGGGTAT CAGATCGGTA TTCTTCATTA CCGGGGCATT GTTACTGGTA 
AATGCAGTCT GGGTCTATTT CAAGGTGTAT AAAAATATCC GTATCGCAGA ATATGCATAA

Protein sequence

MQNWKRNLIV CWFGMFMTGM GLSQIAPVLP LYIQHLGVDN TALIEQFSGI AFGVTFIISA 
IFSPIWGLAA DKFGRKSMLL RASLGMAIVI GCMGFAQNVY QLIGLRLLQG VITGYSSACT 
ALIATQTDRE HAGWALGTLS TSSIAGTLLG PMIGGYIAEN LGFQEVFFIT GALLLIAFIA 
TALFVNESFT RQDRMVLSIK ETWGTVPHKS LTLILFVSSF VMTLALYSVQ PILTIYITQL 
SSTTSHVALL AGMTFSASGL ASIVAASQLG KLSDKIGPQK VMLAALIVAG LIFIPQAFVT 
DPWQLMALRF VLGLAIAGLI PSVNTLLKRI TPDSLTGRVF GFNMSAGYLG VFGGSVLGGQ 
VAAYLGIRSV FFITGALLLV NAVWVYFKVY KNIRIAEYA