Gene M446_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1969
Symbol
ID	6134356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2195368
End bp	2197134
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	67%
IMG OID	641642200
Product	extracellular solute-binding protein
Protein accession	YP_001768868
Protein GI	170740213
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.386461
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGCC ACAGCCGCGC CCTGCTCCAC GGTGCGAGCG CGCTCGCGCT CGGCGCCGCC 
CTCGCGCTCG GCCCCGCCGC CCCCGCGCGG GCCGGCATGG AGGAGGCCAG GCGCTGGGTC 
GAGACCGAGT TCCAGCCCTC GACGCTGTCC AAGGACGAGC AGCTCAAGGA GATGCAGTGG 
TTCGTCGACG CGGCGAAGCC CTTCGTCGGC CAGGAGATCA ACGTCGTCTC CGAGACCCTC 
ACCACGCACG AGTACGAGGC CAAGACCCTG GCCAAGGCCT TCACGGAGAT CACCGGGATC 
AGGATCCGCC ACGACGTCAT CCAGGAGGGC GACGTCGTCG AAAAGATCCA GACGCAGATG 
CAGTCGGGCA AGAACATCTA CGACGGCTGG ATCAACGATT CCGACTTCAT CGGCACCCAC 
GCCCGCTACA ACCAGACCGT CAACCTGACC GACTGGATGG CCGGCGCGGG CCGGGACGTC 
ACCCTGCCGA GCCTCGACGT CGAGGATTTC ATCGGCAAGT CGTTCGGCAC CTGGACCGAT 
GGCAAGCTGT TCCAGCTGCC CGACCAGCAA TTCGCCAACC TGTACTGGTT CCGTTACGAC 
TGGTTCCAGC GCCCCGACCT CAAGGAGAAG TTCAAGGCCA AGTACGGCTA CGAACTCGGC 
GTGCCGGTGA ACTGGTCGGC CTACGAGGAC ATCGCGGAAT TCTTCACCAA CGACGTGAAG 
GAGATCGATG GCCAGCGGGT CTACGGCCAT ATGGATTACG GCAAGAAGGA CCCGTCGCTG 
GGCTGGCGGT TCACCGACGC GTGGCTCTCG ATGGCCGGCA ACGGCGACAA GGGCATCCCG 
AACGGCAAGC CGGTGGACGA GTGGGGCATC CGCCTCGACG GCTGCCGGCC GGTCGGCTCC 
TCGGTCGAGC GCGGCGGGGA CACCAACGCC CCGGCCTCCG TCTACGCCGT GACCAAGTAC 
GTCGAGTGGC TGAAGAAGTA CGCGCCGCCG CAGGCCGCCG GCATGACCTT CTCGGAATCC 
GGGCCGGTGC CGGCGCAGGG CAACGTCGCC CAGCAGATCT TCTGGTACAC CGCCTTCACG 
GCCGACATGG TCAAGCCCGG CCTGCCGGTG GTGAACCCGG ACGGCTCGCC GAAATGGCGC 
GTCGCGCCCT CGCCGCACGG CGCCTACTGG AAGGAGGGCA TGAAGCTCGG CTACCAGGAT 
GCCGGCTCGG TCACGCTGCT CAACTCCACC CCGGTCGAGC GCCGCAAGGC CGCCTGGCTG 
TACCTCCAGT TCATCAACTC GAAATCGGTG AGCCTGAAGA AGAGCCACGT CGGCCTCACC 
TTCACGCGCG AGAGCGACAT CTGGGACAAG TCCTTCACCG AGCGGGCGCC GAGGCTCGGC 
GGGCTGATCG AGTTCTACCG CTCGCCGGCC CGGGTGCAGT GGACGCCGAC CGGCGTCAAC 
GTGCCGGACT ACCCGAAGCT GGCGCAGCTC TGGTGGCAGA ACATCGGCGA CGCCTCCTCG 
GGCGCCAAGA CCCCGCAGGC GGCCATGGAC GCGCTCGCGG CCGCCCAGGA CGACGTGATG 
GCCCGGCTCG AACGCTCCAA GGTCCAGGGC GAGTGCGGGC CGAAGCTCAA CCCCAAATCC 
TCGGCCGAGG AATGGTACAA GAGGGCCGAG ACGAGCGGCA CCATCGCGCC CCAGCGCAAG 
CTCTCCACCG AGAAGCCGAA GGGCGAGACG GTGGATTACG ACACGCTGAT CAAGAGCTGG 
CCGGCCTCGC CGCCGCGCCG CAGCTGA

Protein sequence

MTRHSRALLH GASALALGAA LALGPAAPAR AGMEEARRWV ETEFQPSTLS KDEQLKEMQW 
FVDAAKPFVG QEINVVSETL TTHEYEAKTL AKAFTEITGI RIRHDVIQEG DVVEKIQTQM 
QSGKNIYDGW INDSDFIGTH ARYNQTVNLT DWMAGAGRDV TLPSLDVEDF IGKSFGTWTD 
GKLFQLPDQQ FANLYWFRYD WFQRPDLKEK FKAKYGYELG VPVNWSAYED IAEFFTNDVK 
EIDGQRVYGH MDYGKKDPSL GWRFTDAWLS MAGNGDKGIP NGKPVDEWGI RLDGCRPVGS 
SVERGGDTNA PASVYAVTKY VEWLKKYAPP QAAGMTFSES GPVPAQGNVA QQIFWYTAFT 
ADMVKPGLPV VNPDGSPKWR VAPSPHGAYW KEGMKLGYQD AGSVTLLNST PVERRKAAWL 
YLQFINSKSV SLKKSHVGLT FTRESDIWDK SFTERAPRLG GLIEFYRSPA RVQWTPTGVN 
VPDYPKLAQL WWQNIGDASS GAKTPQAAMD ALAAAQDDVM ARLERSKVQG ECGPKLNPKS 
SAEEWYKRAE TSGTIAPQRK LSTEKPKGET VDYDTLIKSW PASPPRRS