Gene Mboo_0388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_0388
Symbol
ID	5410619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	376396
End bp	377796
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	55%
IMG OID	640867602
Product	major facilitator transporter
Protein accession	YP_001403551
Protein GI	154149933
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00816882
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAT CCAACTTGCC TCAACCCGCC GAAAGTAAAA TAGCGTTCGA CTGGCGGTTT 
GTAACACCGC TGTATATCGG CTCCGCCCTC AATCCTGTCA ACACTTCGTT CATTGCCACT 
GCCCTGGTGC CAATTGCAGC GGCCATCAAC GTTCCGGTCG GACAGACTGC TGTTCTTGTC 
GCGGCACTCT ATATCGCATG TATCGTTGCC CAGCCGGCAG CCGGAAAATT ATCGGAGGCA 
TTTGGGCCAC GGAGGGTGTT CCTTGCAGGT ATTCTCGCAG TACTTGCCGG AGGAGTGCTG 
GGTGGATTAG GCCATGACCT CGCAACGCTG ATCGTATCAC GGGTCCTGAT TGGTGTGGGC 
ACCTCGACCG GATATCCTTC GGCAATGCTT TTGATCCGAC AGCGGGCCGA ATCGGCCGGG 
CTGACCGGGC CCCCGGGAGG AGTGCTTGGC GGCCTTGTGA TTGCCGGAAT GGCGACTGCG 
GTTATAGGTC TGCCCATTGG CGGATTCCTC GTCGCCGCCT GGGGCTGGCA GAGCGTGTTT 
TTTATTAACG TCCCGCTGGC TCTCGTGGCG CTCATTATGG CTGCATCTTG GATCCCCCGG 
GATCCGCCAT GCAGGAGCAT AAAGACGCTC CGTGACCTGG CAACCCGCAT TGATCTGGCC 
GGCATCACGG TCTTTAGTGG CGCGATGATT GCCCTTCTGG TCTTTCTCAT GTCACTGCCG 
GATCCGGATT GGGTTGTTTT AGGCGTAGTT ATTCTGCTCG GTCTGGCCTT TGTCTGGTGG 
GAAGGACAGG TGAGCCAGCC TTTTATTGAC CTCCGTCTGT TAGGAACGAA CCGGCCATTG 
ATACTCACCT ATGTGCGCTT TGCCCTTGCG ATGCTGTGCG TCTACACCGT AATGTATGGT 
GTCACGCAAT GGCTTGAGAT CGACAAAAAT ATTTCGTCCG CTGATGCAGG ATTCATCATT 
TTGCCCATGA GTCTCATATC CATTGTGCTA GCGTGGCTGG TCTCGCGGCT GAACCTCGTG 
CGCACTCCCC TTATTGTGTC TGCCGTTGCC TGCCTGGCAG GTTCTGCGGG CGTATTTTTA 
TTCACCACGG CGACGCCGAT ACTCTGGATC GTTATAATCA CGGCGATCTT CGGGATTACC 
ATGGGGATGT GTGCCAGTGC GAACCAGACA ACATTTTACA CCCAGGTAAC CGCAGATCAG 
ATCGGTACCG CTTCAGGCCT GTTCCGTACT TTTGGGTATT TTGGCTCGGT TGCATCGTCG 
GCCCTTATCG CGATATTCTT TAATCCCGAT GTCAGCGATC AGAGCCTGCA TTCAATTGCT 
GCAGTACTGG TGATCCTCAG CGTTGTGGGA CTGCTTATTG TCATTGCCGA CAGGAAAATC 
ATGGCTCTGG CAAAAGTATA G

Protein sequence

MNTSNLPQPA ESKIAFDWRF VTPLYIGSAL NPVNTSFIAT ALVPIAAAIN VPVGQTAVLV 
AALYIACIVA QPAAGKLSEA FGPRRVFLAG ILAVLAGGVL GGLGHDLATL IVSRVLIGVG 
TSTGYPSAML LIRQRAESAG LTGPPGGVLG GLVIAGMATA VIGLPIGGFL VAAWGWQSVF 
FINVPLALVA LIMAASWIPR DPPCRSIKTL RDLATRIDLA GITVFSGAMI ALLVFLMSLP 
DPDWVVLGVV ILLGLAFVWW EGQVSQPFID LRLLGTNRPL ILTYVRFALA MLCVYTVMYG 
VTQWLEIDKN ISSADAGFII LPMSLISIVL AWLVSRLNLV RTPLIVSAVA CLAGSAGVFL 
FTTATPILWI VIITAIFGIT MGMCASANQT TFYTQVTADQ IGTASGLFRT FGYFGSVASS 
ALIAIFFNPD VSDQSLHSIA AVLVILSVVG LLIVIADRKI MALAKV