Gene M446_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4043
Symbol
ID	6128945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	4510187
End bp	4511233
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	641644198
Product	extracellular solute-binding protein
Protein accession	YP_001770838
Protein GI	170742183
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0937845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCTCG ACCGCCGCCG CCTCCTCACC ACCGCCCTCT CGCTCGGCGC GATGGAGCTC 
TTCCCCGGCC TCTCCCTCGC GCAGGCGAGG CCCCTCGTCT TCGCCACCTT CACGGGGAGC 
TGGGAGGAGG CGCACAAGGC CGTGCTGGTC CCCGCCTTCC GCAAGGAGAC CGGCAACGCC 
CCGATCGTCC TCGACCCGAT GCTGTCCGTC GACCAGATCG CCAAGGTCTC GGCCGCCCGC 
GCGAACCCGC CGATCGACGT GATGCTGCAC GATCCGGGCC CGGCGCTCAC CGCCCAGGCG 
CAGGACCTCG TCGAGCCCTA CCCGGTCGAG CGCAGCGCCT CCTTCAAGGA CCTCATCCCG 
GACGCGCAGG AGGCGACCGG CCCGGCGGCC TTCTTCCAGG TCGTCGGTCT GACCTACAAT 
CCCGACACGG TGAGGACGAA GCCCACCTCC TGGGCCGATC TGTGGCGGCC CGAATACAAG 
GGCCGGGTCG GCATCACCAA CATGAACTCG ACGCTCGGCA CCGGCTTCAT GGTCGAGATC 
GCCAAGATGC ACGGCGGCTC CGAGGCGAAC ATCGATCCGG CCTTCAAGGC CATGGAGGCG 
CTCAAGCCCA ACCTCTCGGC GGTGGCGGCC AATCCGGGGG CGCTCGCCAC CCTGTTCCAG 
CAGGGCCAAG TCGACATTTC GCCCGGCAAC TTCAACGCCA TCCAGATCCT CAAGGCCAAG 
GGCGTTCCGG TCGAGTTCGT GGCGCCCAAG GAGGGGGCGA TCGCCTTCAA GACCGCGATC 
CAGATCGTCA GGAACTCGCC CAACCGCGAC CTCGCCTTCA AGCTGATCGA GGCGGCGATC 
TCCGAGCCGG TCCAGACCCG GCTGATGCAG GCCCCCTACC TGATCGTGCC GACCAACGCC 
AAGGTGACGA TGAGCGGCGA GATCGCCCAG GTGCTCGCCC GGGACACCGA CGACCTGCGC 
AGGAAATTCG TGTTCCAGGA CTGGAAGGCC ATCAACGCGC AGCGGGCGGC CTGGATGGAG 
CGGTTCAACC GCGAGATCAA GCTCTAG

Protein sequence

MILDRRRLLT TALSLGAMEL FPGLSLAQAR PLVFATFTGS WEEAHKAVLV PAFRKETGNA 
PIVLDPMLSV DQIAKVSAAR ANPPIDVMLH DPGPALTAQA QDLVEPYPVE RSASFKDLIP 
DAQEATGPAA FFQVVGLTYN PDTVRTKPTS WADLWRPEYK GRVGITNMNS TLGTGFMVEI 
AKMHGGSEAN IDPAFKAMEA LKPNLSAVAA NPGALATLFQ QGQVDISPGN FNAIQILKAK 
GVPVEFVAPK EGAIAFKTAI QIVRNSPNRD LAFKLIEAAI SEPVQTRLMQ APYLIVPTNA 
KVTMSGEIAQ VLARDTDDLR RKFVFQDWKA INAQRAAWME RFNREIKL