Gene M446_0671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_0671
Symbol
ID	6132948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	778423
End bp	780027
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	69%
IMG OID	641640990
Product	extracellular solute-binding protein
Protein accession	YP_001767665
Protein GI	170739010
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGGC TTGCGGCGGC GGGAACGGCC CTGCTGCTCA CCCTCGCGGG GGCGGTCCTC 
GCCCAGACGC CGAAGGCGGG CGGCGTCGCC CAGGCGCCGA AGGCGGGCGG CATCGCCCAA 
GTGCCGAAGG CGGGCGGCAT CGCCAACGCG ATCATCCAGC CCGAGCCGCC GGGGCTGATG 
CTCGGCCTGC TGCAGAACGG CCCGACCCAG ATGGTGGCCG GCAACATCTA CGAGGGGCTG 
CTGCGCTACT CCGAGAGCCT CGAGCCGCGG CCCGGCCTCG CCGAATCCTG GGAGGTCGGC 
CCGGACGGCC GGACCTACAC CTTCCACCTC GTGCGGAACG CCACCTGGCA CGACGGCAAG 
CCGTTCACCG CCGAGGACGT GCTGTTCTCG GTCGAGTTCC TCAAGCAGAC CCATCCGCGC 
GCCCGGGCCA ACATGGCCAA GGTCGCGAGC CTCACGGCGC CCGACCCCTA CACGGTGGTG 
TTCACGCTCT CGGAGCCGTT CGGCCCCTTC CTGGGCGTGT TCGAGGTCGG CTCGCTGCCG 
ATGATCCCCA AGCACCTCTA CGCGGGCACC GACTACAAGA CCAACCCGGC CAACACCACC 
CCGATCGGCA CCGGCCCGTT CCTGTTCAAG GAATGGAAGA AGGGCGCCTA CATCCGGCTG 
GTCAAGAACC CGGCCTACCA CGTGGCGGGA CGGCCCTACC TCGACGAGAT CTACTGGCAC 
GTGATCCCGG ACGCCGCCTC GCGGGCGGTC GCCTTCGAGA CCGGCAAGGT CGACATCCTG 
CCGGGCGGCT CGGTCGAGAA TTTCGACGTG CCGCGGCTGT CGCAGCTGAA GGGCGCCTGC 
GTGACCGGCA AGGGCTGGGA GTTCTTCGGC CCCCATTCCT GGCTCTGGCT CAACAATCGC 
CAGGGCCCGA CCGCCAGCAA GGCCTTCCGG CAGGCGGTCT CCTACGCGAT CGACCGCGAC 
TTCGCCCGCG ACGTGATCTG GAACGGGCTC GGCAAGCCGG CGATCGGCCC GATCTCCTCC 
TCGACGCGCT TCTTCAACCC GGGCCTCGGC CGGTACGCCT ACGACCCCGC CAAGGCGAAG 
GCGCTGCTCA AGGAATCCGG CTACAAGGGC GAGACCCTGC GCCTCCTGCC GGTGCCCTAC 
GGCGAGACAT GGCAGCGCTG GGCCGAGGCG GTGAAGCAGA ACCTGGAGGA TGTCGGCATC 
AGGACCGAGA TCGTCGCCAC CGACGTCGCC GGCTGGAACC AGAAGACCTC GGACTGGGAC 
TACGACATCG CCTTCACGTA CCTCTACCAG TACGGCGACC CGGCGCTCGG CGTGGCGCGC 
AACTACGTCT CCTCGCAGAT CGCCAAGGGC TCGCCGTTCA ACAACGTCGA GGGCTACGCC 
AATCCGGCGG TCGACGAGGC CTTCGCGCAG GCCGCGGCGG CGGTGAGCCC CGCCGAGCGG 
CAGGCCCTGT ACGACCGGGC CCAGACGACC CTGATCGAGG ACGCGCCGGT GGCGTGGCTG 
CTCGAACTCC AGTTCCCGAC CATCACCCGC TGCAAGGTGC ACGACCTCGT CACCACCGGG 
ATCGGCGTGA ACGACGGCTT CCGCGACGCC TGGATCGAGC GCTGA

Protein sequence

MIRLAAAGTA LLLTLAGAVL AQTPKAGGVA QAPKAGGIAQ VPKAGGIANA IIQPEPPGLM 
LGLLQNGPTQ MVAGNIYEGL LRYSESLEPR PGLAESWEVG PDGRTYTFHL VRNATWHDGK 
PFTAEDVLFS VEFLKQTHPR ARANMAKVAS LTAPDPYTVV FTLSEPFGPF LGVFEVGSLP 
MIPKHLYAGT DYKTNPANTT PIGTGPFLFK EWKKGAYIRL VKNPAYHVAG RPYLDEIYWH 
VIPDAASRAV AFETGKVDIL PGGSVENFDV PRLSQLKGAC VTGKGWEFFG PHSWLWLNNR 
QGPTASKAFR QAVSYAIDRD FARDVIWNGL GKPAIGPISS STRFFNPGLG RYAYDPAKAK 
ALLKESGYKG ETLRLLPVPY GETWQRWAEA VKQNLEDVGI RTEIVATDVA GWNQKTSDWD 
YDIAFTYLYQ YGDPALGVAR NYVSSQIAKG SPFNNVEGYA NPAVDEAFAQ AAAAVSPAER 
QALYDRAQTT LIEDAPVAWL LELQFPTITR CKVHDLVTTG IGVNDGFRDA WIER