Gene M446_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1646
Symbol
ID	6128917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	1840088
End bp	1841410
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	68%
IMG OID	641641904
Product	extracellular solute-binding protein
Protein accession	YP_001768573
Protein GI	170739918
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.143266
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTGA ACACGATCCT TCGCGCCGGA CTCGCGGTCC TCGGGATCGC GGCGGCCGGT 
CCCGCCCTCG CGGTCACCGA ACTGCAATGG TGGCACGCCA TGGTGGGGGC CAACAACGAC 
GCGGTCATTC GGCTGGCCGA GGAGTTCAAC GCCTCGCAGA GCGAGTACAA GGTGGTCCCG 
GCCTACAAGG GTACCTATCC GGAGACGCTG AACGCCGGCA TCGCGGCCTT CCGGGCCGGC 
ACCGCGCCGC ACATCATCCA GGTCTTCGAG GTCGGCACCG CCACCATGAT GGCGGCCAAG 
GGTGCGGTGA AGCCCGTCTA CCAGCTGATG AAGGAGGCGG GCGAGCCCTT CGACCCGAAT 
GCCTACCTGC CGGCCATCAC GGGTTACTAC TCCACCGCCG CCGGGGAGAT GCTGTCCTTC 
CCGTTCAATT CCTCGTCGAT GGTGATGTGG GTCAACCGGG ACGCGCTGAA GAAGGCCGGC 
CTCGACCCGA ACGCGCCGCC CAAGACCTGG CCCGAGGTCT TCGCCGCCGC CAAGGCCCTC 
AAGGCTGCCG GCTACACCAC CTGCGGCGTC TCCAACACCT GGGTGACCTG GGCCCACCTG 
GAGCAGTTCT CGGCCTGGCA CAACGTGCCG CTCGCCACCA AGGCCAACGG GCTCGACGGC 
TTCGACACCG CCCTGCAGAT CAACGGGCCG CTGCAGGTCA AGCACCTCGC GACGCTCGCG 
GAGATGCAGA AGGACAAGCT CTACGACTAT TCCGGCCGCT ACGACAACGG CTTCGGGCGC 
TTCACCTCGG GCGAGTGCCC GCTGATGCTC GGCTCCTCCG GCTCCTACGG CAACGTGCGC 
GGCAACGCCA AGTTCGAGTG GGCGGCGGCC CCGATGCCCT ATTATCCCGA CGCGCCCGGC 
GCGCCGCAGA ACAGCATCAT CGGCGGCGCC TCGCTCTGGG TGATGGGCGG CAAGTCGGCC 
GAGGAGTACA AGGGCGTCGC CAAGTTCTTC GCCTTCCTGT CGGACACCGA GCGGCAGGCG 
CGCATCCACC AGACCACCGG CTACCTGCCG ATCACCAAGG CGGCCTACGA GAAGTCGAAG 
GCGGATGGCT GGTACGACAA GAACCCGGCC CTCGAAGTCC CGCTCAAGGA ACTGACCAAC 
AAGCCGCCGA CCGGGAATTC CCGCGGCCTG CGCCTCGGCA ACATGCCGCA GATGCGCGAC 
GTCTGGGCCG AGGAGATCGA GGCGGCGCTC GCCGGCAAGA AGAGCGCCAA GGAGGCCCTC 
GACGAGGCCG CCGCCCGCGG CAACGCCATG CTGCGCCAGT TCGAGAAGCA AGCGAACCGC 
TGA

Protein sequence

MALNTILRAG LAVLGIAAAG PALAVTELQW WHAMVGANND AVIRLAEEFN ASQSEYKVVP 
AYKGTYPETL NAGIAAFRAG TAPHIIQVFE VGTATMMAAK GAVKPVYQLM KEAGEPFDPN 
AYLPAITGYY STAAGEMLSF PFNSSSMVMW VNRDALKKAG LDPNAPPKTW PEVFAAAKAL 
KAAGYTTCGV SNTWVTWAHL EQFSAWHNVP LATKANGLDG FDTALQINGP LQVKHLATLA 
EMQKDKLYDY SGRYDNGFGR FTSGECPLML GSSGSYGNVR GNAKFEWAAA PMPYYPDAPG 
APQNSIIGGA SLWVMGGKSA EEYKGVAKFF AFLSDTERQA RIHQTTGYLP ITKAAYEKSK 
ADGWYDKNPA LEVPLKELTN KPPTGNSRGL RLGNMPQMRD VWAEEIEAAL AGKKSAKEAL 
DEAAARGNAM LRQFEKQANR