Gene M446_2186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2186
Symbol
ID	6134738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2435914
End bp	2436888
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	72%
IMG OID	641642413
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001769081
Protein GI	170740426
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.589842
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.269946
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCC ATCGCCGCGC GCTGATCGGC GCCGCGTTCG GCCTCGCCGG CCTGTTCTCT 
TTACAGAACC CGGCCGCGGC CCAGGCCGCC AAGGAGGTCC GGCTCGACTG GGCGACCTAC 
AACCCGGTGA GCCTGCTCCT GAAGGAGAAG GGGCTCGTCG AGAAGGCGCT GGCGGCCGAC 
GGCGTCAGCG TGCGCTGGGT GCAGTCGCTC GGCTCCAACA AGGCCCTGGA ATTCCTCAAC 
GCAGGCTCGC TCGATTTCGG CTCGACGGCG GGGGCGGCGG CCCTGCTCGG GCGGATCAAC 
GGCAACCCGA TCAAGTCCGT CTACGTCTAT TCCCGACCGG AATGGACCGC CCTCGTCACG 
CGCCCGAATA CCGGCATCGC GGCGGTGAAG GACCTGAAGG GCAGGCGCGT CGCGGTCACC 
CGCGGCACCG ACCCGCACAT CTTCCTGATC CGCGCCCTGC AGGGGGCCGG GCTGACCGAG 
CGGGACGTGA AGCTCGTGCT GCTCCAGCAC CCGGACGGGC GCACGGCCCT CGACCGCGGC 
GACGTCGATG CCTGGGCGGG CCTCGACCCG ATCATGGCGG CGGCCGAGAT CGAGACCGGC 
GACGTGCTGT TCCACCGCGA TCCGGCCGCC AATACCTGGG GCGTGCTGAA CGTGCGGGAG 
GATTTCGCCA AGGCGAACCC GGACCTGACC CGCAAGGTGC TGGCGGCCTA CGAGGAGGCG 
CGCGCCCTCG CGGTGAGCCG GCCCGAGGAA CTGCGGCGCG CGCTCGTGGC GGCGACGAAG 
CTGCCCGAGC CGGTGGTCGC CCGCCAGCTG GAGCGCACCG ACGTGTCCCA GCCGAATATC 
GGGCCGGCCC AGGCCGAGTC GATCCTGGCG GCCGGCAAGG CCCTGCGCGA GGCCGGCGTG 
ATCCCGGCCG GCACCGACGT CGAGGCGGCC GTCGACGCCC TGATCGACCG GCGCTTCAAC 
ACCGCCGCGC GCTGA

Protein sequence

MRIHRRALIG AAFGLAGLFS LQNPAAAQAA KEVRLDWATY NPVSLLLKEK GLVEKALAAD 
GVSVRWVQSL GSNKALEFLN AGSLDFGSTA GAAALLGRIN GNPIKSVYVY SRPEWTALVT 
RPNTGIAAVK DLKGRRVAVT RGTDPHIFLI RALQGAGLTE RDVKLVLLQH PDGRTALDRG 
DVDAWAGLDP IMAAAEIETG DVLFHRDPAA NTWGVLNVRE DFAKANPDLT RKVLAAYEEA 
RALAVSRPEE LRRALVAATK LPEPVVARQL ERTDVSQPNI GPAQAESILA AGKALREAGV 
IPAGTDVEAA VDALIDRRFN TAAR