Gene Mpe_A0232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0232
Symbol
ID	4783940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	247783
End bp	249090
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	74%
IMG OID	640088783
Product	sodium:galactoside symporter family protein
Protein accession	YP_001019429
Protein GI	124265425
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.626751
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC GGGCCATGGC AGCGCTCGGC CTGCCGCCCG CCACAGCCGG GCTGGCTTCG 
TCCGGCGACG GCCTGCGCTA CGGCGCCCTC GGCCTGCCGC TGGCCTTCGT CGCACTGCCG 
CTGTACGTGC TGCTGCCGAA CCACTACGCG GCGCAGTTCG GCGTGCCGCT GGCCGCGCTC 
GGCGCCGTGC TGCTCGCCGC GCGCCTGCTG GACGCGCTGG CCGACCCCCT GATCGGCCGC 
TGGGTGGACC GGCTGTTCGC GCGGAAGGTC CTGTCAGCGT GGTGGGCCGC CACGATCGCG 
GCGCTGGTGC TCGCGACCGG CTTTCGCGCG CTGTTCTTTC CCGCCGTCGA AGGCACGGCG 
GCCCTGCTCG CGTGGTGCGC GATCGGTCTG GTCTTCACCT ACCTGGGCTA CAGCGTGGTC 
TCGGTGGTCC ACCAGGCCTG GGGGGCACGG CTCGGCGGCG ACGAGGCGGG CCGCGCCCGC 
GTGGTCGCGT GGCGCGAAGG GGCCGCGGTG GTGGGCGTGC TGATCGCCAG CGTGCTGCCG 
TCGGCGTCCG GCCTGCAGGC CACCACGCTG GTGTTCGCGG TGCTGCTGCT GGCCGGGCTG 
GCGCTGCTGC GGCAGGCACC AAGGGCGGTG CTTCGCCCAC CTCTGGACGC CGGCGGCGCC 
GCATCGGTGC AGCCGTTTCG CGTGACGGCG TTTCGACGCC TGCTGGCGAT CTTCATCGTC 
AACGGCATCG CCAGCGCAGT ACCGGCCACG CTGGTGCTGT TCTTCATCCG CGACCGGTTG 
CAGGCACCGG CCTGGGAGCC TGCTTTCCTG GCAGCGTACT TCGCGGCCGG CGCGCTATCG 
ATCCCGCTGT GGCTGCGCAG CGTCGCCCGC TTCGGCCTGG CGCGCAGTTG GCTCGCCGGC 
ATGGGGCTGG CGATTGCCAC CTTCGGCTGG GCCGCGACGC TGGGCGCCGG CGACACGCTC 
GGCTTCCTCG CGGTGTGCAT CGCCAGCGGC GCGGCGCTCG GCGCCGACCT CACGCTACCC 
GGCGCGCTGC TGACCGGCGT GATCCAGCGT GCTGGCCACG CCGGCCACGG CGAGGGCGCC 
TACCTCGGCT GGTGGAACTT CGCGACCAAG CTCAACCTCG CGCTCGCCGC GGGCGTGGCC 
TTGCCGTTGC TGCAGGCCAC GGGCTACGAG ACCGGTGCGC GAGACCCCCA GGCGCTCGCC 
GCGCTGAGCT TCGCCTACTG CCTGCTGCCG TGCGCGCTGA AGCTCGGCGC CGCGCTGCTG 
CTGTGGGCGC TGTGGCTGCG CCACCCCGAC GCTGGAGATT TCGCATGA

Protein sequence

MSERAMAALG LPPATAGLAS SGDGLRYGAL GLPLAFVALP LYVLLPNHYA AQFGVPLAAL 
GAVLLAARLL DALADPLIGR WVDRLFARKV LSAWWAATIA ALVLATGFRA LFFPAVEGTA 
ALLAWCAIGL VFTYLGYSVV SVVHQAWGAR LGGDEAGRAR VVAWREGAAV VGVLIASVLP 
SASGLQATTL VFAVLLLAGL ALLRQAPRAV LRPPLDAGGA ASVQPFRVTA FRRLLAIFIV 
NGIASAVPAT LVLFFIRDRL QAPAWEPAFL AAYFAAGALS IPLWLRSVAR FGLARSWLAG 
MGLAIATFGW AATLGAGDTL GFLAVCIASG AALGADLTLP GALLTGVIQR AGHAGHGEGA 
YLGWWNFATK LNLALAAGVA LPLLQATGYE TGARDPQALA ALSFAYCLLP CALKLGAALL 
LWALWLRHPD AGDFA