Gene M446_3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3858
Symbol
ID	6131997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4304013
End bp	4305089
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	66%
IMG OID	641644023
Product	extracellular solute-binding protein
Protein accession	YP_001770665
Protein GI	170742010
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAGC CGAGCGCACC CGGACTTGGT GTCGCGAGTG GAACGCGGCC GACGCGCCGC 
TCTCTCCTCG CCGGAGCCGC CGGATTCCTG GCGGCCCCGG CCGTCCTCAC CGGCAGAGCG 
CGCGCGGACA CGACCCTGAC GGTGACCTGC TGGGGCGGCG ACTACCGGGC GGGCATCGAC 
AGGATCTTCG CGCAGCCCTT CACGAAGGAA ACCGGGATCG CCGTCCGTCT CGTTGACAAT 
GCCGACCTCG CTCGCATGAA GGCGCAGGTC CAGACCGGCC GCGTCGAATG GGACGTTTTC 
GACAGTGTCG GACCGCAGAT CACGGCCGGC GCGAAGGAGG GCCTCTGGGA GGAGGTCGAC 
GGCAAGATCG TGGACCGCTC GGACCTCACC GCTCCCGGCG GGCCGAGCTA TGTCGGGACC 
TACCTGTTCG CGGGCGGGAT CGCGTACGAT CCCAAGCGGT TTCCCGAAGG CAAGTATCCC 
GTCACCTTCA AGGATTTCTG GAACGTCGAC GGCTTTCCGG GCCGCCGCGG CCTGCGCACC 
AGGGTGAGCG AGAACCTTGA GATCGCGCTG CTCGCCGACG GCGTCGCCCC GAAGGACCTC 
TATCCGCTGG ACGTCGAGAG AGCCTTTCGG TTGCTCGATC AGATCAAGCC TGCCGTGAAG 
AAGTGGATCG AGACCACGCC ACAATCGCTG TCTCTCGTCA CCACGAACGA AATCGACTTC 
TCCTACACCT ACATGTCGCG CGTGCGGCCG GCGCAGCTGG CCGGGAGCTC CGTCTCCCTG 
TCGACGCAGC AGACGCTCAA CTCCCTCGAA TATCTGGCCG TCGCCAAAGG CTCCCGCAAC 
CGGGAGGCCG CGTTCCGCTA CATCGCGTTC TGCCTGAGGC CCGACCGCCA AGCGGCCTTC 
GGCGAAATGC TGTTCTTCAG CCCAAATTCG CGCAAGGGAT TCGAGGCCTC CACCCCGGCC 
GCCCGCCAGT ACATGCCCGA CATGGCGAGC CCGAAGAACG CGATCCTCAA CGACGATTGG 
TGGGCGGACC GCTACACGCC GCTTCAGAAG CGCTTCACGG AGTGGCTCCT GGTCTGA

Protein sequence

MSKPSAPGLG VASGTRPTRR SLLAGAAGFL AAPAVLTGRA RADTTLTVTC WGGDYRAGID 
RIFAQPFTKE TGIAVRLVDN ADLARMKAQV QTGRVEWDVF DSVGPQITAG AKEGLWEEVD 
GKIVDRSDLT APGGPSYVGT YLFAGGIAYD PKRFPEGKYP VTFKDFWNVD GFPGRRGLRT 
RVSENLEIAL LADGVAPKDL YPLDVERAFR LLDQIKPAVK KWIETTPQSL SLVTTNEIDF 
SYTYMSRVRP AQLAGSSVSL STQQTLNSLE YLAVAKGSRN REAAFRYIAF CLRPDRQAAF 
GEMLFFSPNS RKGFEASTPA ARQYMPDMAS PKNAILNDDW WADRYTPLQK RFTEWLLV