Gene Mpal_1264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1264
Symbol
ID	7271542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1291897
End bp	1293297
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	54%
IMG OID	643569898
Product	major facilitator superfamily MFS_1
Protein accession	YP_002466322
Protein GI	219851890
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.543529
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAAT CCAACTCACC TCAACCCACA AAAAGTGAAA AAGCGTTCGA TTGGCGTTTT 
GTAACACCTC TCTATATCGG CTCCGCACTA AATCCTGTCA ACAGTTCGTT CATTGCCACT 
GCGCTGGTGC CAATAGCAGC GGCCATCAAC GTTCCGGTCG GACAGACTGC TGTTCTGGTC 
GCAGCACTCT ATATGGCATG TATCGTTGCC CAGCCGGCAG CCGGAAAATT ATCTGAGGCA 
TGTGGGCCAC GGCGGGTGTT CCTTGCAGGT ATTCTCGCTG TACTGGTTGG AGGAGTGCTG 
GGTGGCTCAG GCCATGACCT CGCAACGTTG ATCATATCGC GGGTCCTGAT TGGTGTGGGC 
ACCTCGACCG GCTATCCTTC GGCAATGCTT TTGATCCGAC AGCGGGCCGA ATCGGCCGGG 
CTGACCGAGC CCCCGGGAGG AGTGCTTGGC GGCCTTGTGA TAGCGGGAAT GGCGACTGCG 
GTTATAGGTC TGCCCATTGG CGGATTCCTC GTCGGCGCCT GGGGCTGGCA GAGCGTGTTT 
TTTATTAACG TCCCGCTGGC TCTCGTAGCA CTCATTATGG CTGTGTCCTG GATCCTCCGG 
GACCCGCCAA GCAGGAGTAC AAAGACGCTC CGTACCCTGG CAGCCCGCAT CGATCTGGCC 
GGCATCACGG TCTTTAGTGG CGTGATGCTT TCCCTCCTGG TCTTTCTCAT GTCATTGCCA 
GATCCGGATT GGGTTGTTTT AGGCGTAGCT GTTCTGCTCG TTTTGGCCTT TGTCTGGTGG 
GAAGGACAGG TGAGTCAACC TTTTATTGAC CTCCGCCTGT TGGCAACGAA CCGGCCATTG 
ATACTCACCT ATGTGCGCTT TGCCCTTGCA TCGCTGTGCG TCTACACCGT AATGTATGGT 
GTCACGCAAT GGCTTCAGAT CGACAAAAAT ATTCCATCCG CTGATGTCGG ATTCATCATT 
TTGCCAATGA GTCTCATATC CATTGTGCTT GCGTGGCCGG TATCGCGGCT GAACCTCGTG 
CGCACTCCCC TTATTGCGTC CGCCGTTGCC TGCTTGATAG GGTCTGTGGG TGTACTTTTA 
TTTACCACGG CGACTCCACT AATCTGGATA GTTGTAGTCA CTGCGATCTT CGGGATTACC 
ATGGGGATGT GCACCAGTGC GAACCAGACA GCCTTTTACA CCCAGGTCAC CGCAGATCAG 
ATCGGTACCG CTTCAGGCCT GTTCCGTACC TTTGGGTATT TGGGCTCGAT TACATCGTCG 
GCCCTTATCG CGATATTCTT TAATCCAAAT GTCAGCGATC AGAGCCTGCA TTCAATTGCT 
GCCGTTATGG TGATCCTGAG CGTTGTGGGG CTGCTTATTG TCATTGTCGA CAGGAAAATC 
ATGGTGCTGG CAAAAGTATA G

Protein sequence

MNKSNSPQPT KSEKAFDWRF VTPLYIGSAL NPVNSSFIAT ALVPIAAAIN VPVGQTAVLV 
AALYMACIVA QPAAGKLSEA CGPRRVFLAG ILAVLVGGVL GGSGHDLATL IISRVLIGVG 
TSTGYPSAML LIRQRAESAG LTEPPGGVLG GLVIAGMATA VIGLPIGGFL VGAWGWQSVF 
FINVPLALVA LIMAVSWILR DPPSRSTKTL RTLAARIDLA GITVFSGVML SLLVFLMSLP 
DPDWVVLGVA VLLVLAFVWW EGQVSQPFID LRLLATNRPL ILTYVRFALA SLCVYTVMYG 
VTQWLQIDKN IPSADVGFII LPMSLISIVL AWPVSRLNLV RTPLIASAVA CLIGSVGVLL 
FTTATPLIWI VVVTAIFGIT MGMCTSANQT AFYTQVTADQ IGTASGLFRT FGYLGSITSS 
ALIAIFFNPN VSDQSLHSIA AVMVILSVVG LLIVIVDRKI MVLAKV