Gene Mpe_A0228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0228
Symbol
ID	4784013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	244812
End bp	245993
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	73%
IMG OID	640088779
Product	hypothetical protein
Protein accession	YP_001019425
Protein GI	124265421
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.624133
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCCG ATGCTCCCGT GGGCCGCGGG CTCTGGCGCA TCGGGGCGGG CACGACGCTG 
GTGGTGCTGG CCTTCAGCGT TGTCAACCCG GTGCTCGCCG TGACGCTTCA GCGCCGGGGT 
GTGAACGCTG GCGCGATCGG CCTGTTCGCG ATGCTGCCCT TCCTGACCGT GGCGACGATG 
ATCCCGGTGA TGCCGCGCGT GTTCGCGCGC CTCGGCGTGA TCCGCGCCTA CCGGGGCGGC 
CTGGTGCTGG GCGTGCTGTC ACTGGCGGGC TATGCGCTGA CCGACAGCTA TCTCGCTTGG 
TGTTGCTGGT CGGTGCTCGG CGCATTGGGC GCGGCGGCCG AATGGAACGG CACCGAGGCG 
CTGATCGCCT TCAACGCGCC GCCGGCCCGG CGCGGCCGCT TCACCGGGAT GTACCAGACC 
GCGCTGGGCG CAGCTCTCGC GGTCGGTCCC TTGCTGCCCG GTGCGCTGCA ATGGCTGTTG 
CCCGCGGGGA AGCCTCTGCA CACGGTGTGG CTGCTGTGGG GCGCCGCCGC CATCTACGCG 
CTGGCGCTGG GAGTCACGGC CGGCCCCGCG GTCGGCCGTC TGCGGGCCTC GCACACCGGC 
GGCGGCCGCG ACAGCCTGCG GGCCGCGCTG CGGGCGCGGC CGGCACTGGT GTGGATTGCC 
TTCGCGGGTG GTGTGTTCGA GGCGGGCCTC GGTGGCATCA CCGCGGCCTA TGGGTCGCAG 
CTCGGCATGT CGCTCGGCGT GGCGACGTCG ATCGCCGGCG CGCTGGGCGT CGGCAGCTTC 
GTGCTGCAGT ACCCGGCCGG CTGGCTGGCG GACCACGCGC CGGTGCGGCG GGTGTTCGGC 
GTCGCCGGTG CCTTGTTGCT GCTGTCGGTG CTGGCCTTCG GCCTGGCACC CCGCGTGGCC 
GCGTTGTTCT GGGTGGCGGC TTTCCTGTGG GGCGCGATCG GCGGCGCGCT CTACACCTTG 
ACGATGGTCC GCGTGGCGCA CGAGTTCACC GGTCGCTCCA CCATCGCCGG CACCGCAGCG 
ATGATCACCG GCTACACCGC CGGCGGCGCC GTCGGGCCGG CGGTCAGCGG CCTGATGCTC 
GAACGCTGCG GTGTGCCGGG GCAGTCGCTT TGGCTGGCCG CGCTCGCCGT CAGCGTGATC 
GCCGTGGCAC TGCGCATGCG TGCCGGACCC GAGGGTCCCT GA

Protein sequence

MSSDAPVGRG LWRIGAGTTL VVLAFSVVNP VLAVTLQRRG VNAGAIGLFA MLPFLTVATM 
IPVMPRVFAR LGVIRAYRGG LVLGVLSLAG YALTDSYLAW CCWSVLGALG AAAEWNGTEA 
LIAFNAPPAR RGRFTGMYQT ALGAALAVGP LLPGALQWLL PAGKPLHTVW LLWGAAAIYA 
LALGVTAGPA VGRLRASHTG GGRDSLRAAL RARPALVWIA FAGGVFEAGL GGITAAYGSQ 
LGMSLGVATS IAGALGVGSF VLQYPAGWLA DHAPVRRVFG VAGALLLLSV LAFGLAPRVA 
ALFWVAAFLW GAIGGALYTL TMVRVAHEFT GRSTIAGTAA MITGYTAGGA VGPAVSGLML 
ERCGVPGQSL WLAALAVSVI AVALRMRAGP EGP