Gene Mchl_1439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1439
Symbol
ID	7116657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	1492672
End bp	1494294
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	66%
IMG OID	643524209
Product	extracellular solute-binding protein family 5
Protein accession	YP_002420244
Protein GI	218529428
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTTCA ATCTGAAGAG AAACGGCGCC GGTGCGGCGC TCGCCGGCCT GCTGCTGCTT 
GGGCTCAGTC CGGCCGCCCT GGCGCAGGGC GTTCTGCGCA TCGGCATGAC AGCGTCCGAC 
ATTCCCCTGA CCACCGGCCA GGCCGACAAC GGCGGCGAGG GCATGCGGTT CATGGGCTAC 
ACAGTCTATG ACGGGCTCAT CAATTGGGAC CTGACGAGCG CGGAACTCGC CTCCGACCTC 
ACGCCCGGCC TCGCCACGAG TTGGACGGTG GACCTGAACG ACCAGACCAA GTGGACCTTC 
AAGCTGCGCC CGGGCGTCAC GTTCCACGAC GGCTCGGACT TCACCGCCGA TGCGGTGGTG 
TGGAACCTCG ACAAGCTCCT GAAGAGCGAT GCGCCCCAGT ACGACCCGCG CCAGTCCGCC 
CAGGGCAAGA CCCGTATCCC GGCGGTGGCG AGCTACCGCG CGGTCGATCC GCTGACCGTC 
GAGATCACCA CCAAGATCCC CGACGCGACG CTGCCCTACC AGATCGCCTG GATCATGATG 
TCCTCCCCCG CCCAGTGGGA GAAACTCGGC AAGTCCTGGG ACGCCTTCGC CAAGCAGCCC 
TCGGGCACCG GCCCGTGGAA GCTGACGCTG TTCGCCCCCC GCGAGCGGGC CGAGATGGCC 
CCGAACCCGG CCTACTGGGA CAAGAAGCGG ATCCCGAAGC TCGACAAGCT GGTGCTGGTG 
CCGCTGCCGG AGGCCAACGC CCGGGTCGCG GCCCTGCGCG CCGGGCAGGT CGATTGGATC 
GAGGCCCCGG CGCCGGACGC CATCGCCTCG TTGAAGGGCG CGGGCTTCAC CATCGTCACC 
AACGCCTACC CGCACAACTG GACGTGGCAT CTCTCCCGGG GCGAGGGCTC GCCGTGGAAC 
GACGTCCGCG TGCGCAGGGC GGTCAACCTC GCCATCGACC GCGAGGGCCT GAAAGAGCTG 
CTGGGCGGGG TGGCGATCCC GGCCAAGGGC TTCTACCCGC CGAACCACCA GTGGTTCGGC 
CGCACCACCT TCGACGTGAA GTACGATCCC GAGGCGGCCA AGAAGCTGCT TGCCGAGGCC 
GGCTACGGCA AGGCGAAGCC GTTGAAGTTC AAGGTGGCAA TCTCGGCCTC GGGCTCGGGC 
CAGATGCAGC CGCTGCCGAT GAACGAGTTC GTACAGCAGA ACCTCGCCGA TGTCGGCGTC 
CAGGTCGACT ACGAGGTCGT CGAGTGGAAC ACGCTGATCA ACGTCTGGCG CGCGGGCGCC 
AAGGCCGACA TCTCCCGCGG CGTATCGGCG ATCAATTACT CCTACTTCAT CCAAGACCCG 
TTCACCGGCT TCATCCGCCA CCTGCAGTGC AACCTCGCGC CGCCGAACGG CACCAACTGG 
GGCTATTACT GCGATCCTGA GATGGACCAG CTGTTCGATC AAGTGCGCAC CACCTTCGAC 
AAGGAGACGC AGAACAAGGT CCTCCAGAAG GTTCACGAGA AGTTCGTCGA CGACGCGCTG 
TTCGTGATGA TCACCCACGA CGTCAATCCG CGGGCGATGA GCCCGAAGGT GAAGGGCTTC 
GTCCAGGCGC GCAACTGGTT CCAGGACTTC TCAACGATCA CCATCGCCAC CGCCGGGCGG 
TGA

Protein sequence

MVFNLKRNGA GAALAGLLLL GLSPAALAQG VLRIGMTASD IPLTTGQADN GGEGMRFMGY 
TVYDGLINWD LTSAELASDL TPGLATSWTV DLNDQTKWTF KLRPGVTFHD GSDFTADAVV 
WNLDKLLKSD APQYDPRQSA QGKTRIPAVA SYRAVDPLTV EITTKIPDAT LPYQIAWIMM 
SSPAQWEKLG KSWDAFAKQP SGTGPWKLTL FAPRERAEMA PNPAYWDKKR IPKLDKLVLV 
PLPEANARVA ALRAGQVDWI EAPAPDAIAS LKGAGFTIVT NAYPHNWTWH LSRGEGSPWN 
DVRVRRAVNL AIDREGLKEL LGGVAIPAKG FYPPNHQWFG RTTFDVKYDP EAAKKLLAEA 
GYGKAKPLKF KVAISASGSG QMQPLPMNEF VQQNLADVGV QVDYEVVEWN TLINVWRAGA 
KADISRGVSA INYSYFIQDP FTGFIRHLQC NLAPPNGTNW GYYCDPEMDQ LFDQVRTTFD 
KETQNKVLQK VHEKFVDDAL FVMITHDVNP RAMSPKVKGF VQARNWFQDF STITIATAGR