Gene Mchl_1332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1332
Symbol
ID	7116305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	1370831
End bp	1371772
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	73%
IMG OID	643524109
Product	aliphatic sulfonates family ABC transporter, periplsmic ligand-binding protein
Protein accession	YP_002420144
Protein GI	218529328
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.449207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.661146
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGCT GGCTCGTCCT GATCGCCCTG GCGCTCGCCA GCCTCGCGCC CGCCCGCGCG 
GAGGAGGTCT TGCGCGTCGG CGACCAGCGC GGCAACGCCC GCGCCCTGAT GGAGGCCACG 
GGCGTGCTCG ACGGCCTCCC CTACCGGCTG GAATGGAGCG AGTTTCCGGC GGCCGCCCCG 
CTGCTGGAAG CGCTGAATGC CGGCGTCATC GATGCGGGCG GCGTGGGCGA TGGCCCCTTC 
ACCTTCGCCG CCGCCGCGGG GGTTCCGGTC AAGGCCTTTC TGGCCTTCCG CAACCGGCAG 
GACGGGCTCG CCATCCTCGT GCAGCCCGAT TCCGCCATCC GCACCGTGGC GGATCTCCAG 
GGCAAGCGGA TCGCCACCAA CCGCGGCTCG ATCGGCCACC AGGTCGTCCT CGCCGCCCTC 
GAAGAAGCGG GGCAGCCCGC CGACAGCGTG CAGTTTCGCT TCCTGCCGCC GGCCGACGCC 
AAGTTGGCGC TGACTTCCGG CGCGGTCGAT GCGTGGTCGA CCTGGGAGCC CTACACCTCC 
GCGGCCGAAC TCGCCGGCCT CGTGCGGGTG CTCCGCGACG GCAACGGCAT CACCCCGGGC 
CTGAGCTACG CGGTGGCGAG CGACGCCGCG CTGAAATCCA AGCGCGCCCT GCTCGCCGAC 
TACGCCGCCC GCCTTGCCAG GGCCCGAGCC CGGGCGCTGA CCGATCCGGC GCCCTACGCT 
GCCGCGTGGT CGCGGCTGAT CGGCCTGCCC GAGGCGGTGC CGCTGCGCTG GTTCGGGCGC 
GCGCGCTACC GCACCGTGCC GATCGATGAC GCCGTGATCG CCGACGAGCA GCGCATCATC 
GACCTCTATG TGCGGGCCGG ACTGATCCCG GCGGCGCGAG CCCCGCGCGC CGAGGCGATC 
CTCGATACCG GGTTTTCGGA CGCGCTTGCC GCCGTGCGAT GA

Protein sequence

MARWLVLIAL ALASLAPARA EEVLRVGDQR GNARALMEAT GVLDGLPYRL EWSEFPAAAP 
LLEALNAGVI DAGGVGDGPF TFAAAAGVPV KAFLAFRNRQ DGLAILVQPD SAIRTVADLQ 
GKRIATNRGS IGHQVVLAAL EEAGQPADSV QFRFLPPADA KLALTSGAVD AWSTWEPYTS 
AAELAGLVRV LRDGNGITPG LSYAVASDAA LKSKRALLAD YAARLARARA RALTDPAPYA 
AAWSRLIGLP EAVPLRWFGR ARYRTVPIDD AVIADEQRII DLYVRAGLIP AARAPRAEAI 
LDTGFSDALA AVR