Gene M446_4681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4681
Symbol
ID	6133270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5152961
End bp	5153992
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	68%
IMG OID	641644826
Product	extracellular solute-binding protein
Protein accession	YP_001771454
Protein GI	170742799
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCC GTCGCACCAT CCTCGCCGGA GGCGCCGCCC TCGCGCTCGC CGGCACCCGC 
GCCCGGCCCG CCCTCGCCGA GACCTCCTCG ATCGTGGTCG GCACCTGGGG CGGCGATTAC 
GGCGCGCTGC TGCAGCAGAA CATCGACATC CCGCTCGTCA AGCCGCTCGG GATCGAGGTC 
TCGCAGGACA TCGCCAACAA CGATCCGCGC CGCACCAAGC TGATCTCGGA GAAGACCAGC 
CGGCGCGGCA GCATGGACGT CGCCTGCATC AACGATATCG ACAGCTACGT GCTCAGCCAG 
CTCGGGGTGC TGGAGATGGT GCCGGCCAGC GCGGTGCCGC GCCTGTCGGC GGTGCTGGAC 
GTCTTCCGCA AGCCGCATTC GATCCCGCAT ATCTACTCGG CGCTCGTGGT GCTCTACAAC 
CCGAGCAAGG TCAGCGCGCC GCCGAAGAGC TATGCCGACC TGTTCGACCC GAAGTACAAG 
GGGCGGGTCG GCTTCTCGGA CATCCTCTAC AGCTACAACA TGGCCGGCGC CAATATCGGG 
GCGGGCGGCA CCATGGGCGA CTTCGCCAAG GGCAAGGCGG CGCTGTTGGA CCTCAGGAAG 
CTCGACCCCA AGGTCTACCC GTCGAACGAG GCCCTGGCGG CGGCGCTGAA ATCCGAGGAG 
GTCTGGCTCG CGCCGATGTG GCTGGCGCGC GGCTTCATGT GGAAGCAGGC CGGCATCCCG 
GTCGAGATGG CGGTGCCCGA GGAGGGCGCG GTGCCGATCC TGTTCGAGGC CGGCGTGCCC 
AAGAACTCGC GCGCCAAGGA CGGGGCCTTC AAGTACCTGA ACGCCATGCT CGACCCGCAG 
GCGCAGGTCG CCTTCGCGGC CAAGATGGGC TACGTGCCGA CCGTGAAGGA CGCCAAGCTG 
CCGGAGGATC TCGCCCGGCA GATCAGCCTG ACCGAGGCCC AGCAGGCCAA GCTCCACCCC 
CTCGACTACG CCTACATGCA GCAGCAGCAG GCCGCCTTCA CCGACTTCTG GAACAAGGAG 
TTCAAGGCCT GA

Protein sequence

MITRRTILAG GAALALAGTR ARPALAETSS IVVGTWGGDY GALLQQNIDI PLVKPLGIEV 
SQDIANNDPR RTKLISEKTS RRGSMDVACI NDIDSYVLSQ LGVLEMVPAS AVPRLSAVLD 
VFRKPHSIPH IYSALVVLYN PSKVSAPPKS YADLFDPKYK GRVGFSDILY SYNMAGANIG 
AGGTMGDFAK GKAALLDLRK LDPKVYPSNE ALAAALKSEE VWLAPMWLAR GFMWKQAGIP 
VEMAVPEEGA VPILFEAGVP KNSRAKDGAF KYLNAMLDPQ AQVAFAAKMG YVPTVKDAKL 
PEDLARQISL TEAQQAKLHP LDYAYMQQQQ AAFTDFWNKE FKA