Gene M446_3927 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3927
Symbol
ID	6134899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4375378
End bp	4376979
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	71%
IMG OID	641644085
Product	extracellular solute-binding protein
Protein accession	YP_001770727
Protein GI	170742072
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.180708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0370442
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCA GATCGCTGCT GAAGGCAATG GCCGGCGCGG GCGCGCTCGC CGCCGGACCC 
TCCTTCCCGG CCCCGGCCCT CGCCCAGGGC GCGGCCAAGA CCCTGCGCTT CGTCCCGCAG 
GCGAACCTCG CCAATTTCGA CCCGATCTGG GGGACCCAGT ACGTGGTGCG CAACGCCGCG 
GCCCTGGTCT GGGACACGCT CTACGGGGTC GACGCGCAGC TGCGGCCCCA GCGCCAGATG 
GTCGAATCCG AGACCGTCTC GTCGGACGGG CTGACCTGGA CCTTCACCCT GCGGCCGGGC 
TTGAAGTTCC ACGACGGCGA GCCGGTGCGG GCGCGGGACG CGGTGGCGAG CCTCGTGCGC 
TGGTCGGCCC GCGACCCGAT GGGGCTGATG ATCCGGGCGA TCCAGGCGGA GCTCTCGGCG 
GTCGACGACC GCAGCTTCCG CTGGGTGCTG ACCAAGCCCT ACCCGAAGAT GCTCCTGGCG 
CTCGCCAAGA ACAACGCGCC CTGCTCCTTC GTGATGCCCG AGCGCATCGC CCAGACCGAC 
CCGTTCAAGC AGATCACCGA GTATGTCGGC TCCGGGCCGA TGCGCTTCGC CCGCGACGAG 
TGGGTGCCGG GGGCGCGGGC GGTGTTCACG CGCTTCGCCG ATTACGTCCC GCGCCAGGAG 
CCGGCCTCCT GGCTCGCGGG CGGCAAGCAG ATCGCCTTCG ACCGGGTCGA GTGGATCATC 
ATGCCGGACC CGGCCAGCGC CTCGGCGGCC CTGCAGAACG GCGAGGTCGA TTGGTGGGAG 
AACCCGATCG CCGACCTCGT CCCGCTGCTC AAGAAGAACC GCAACATCCA GGTCGACATC 
GCCGACCCGC TCGGCAACGT CGGCTCGTTC CGGATGAACA CGCTGCACCC GCCCTTCAAC 
AACCAGCTGG TGCGCCGCGC GGTCCTGATG GCGATGAACC AGGAGGACTA CATGCGGGCG 
ATCGTCGGCG ACGACGACGC GCTGTGGAAG CCGCTGCCCG GCTACTTCAC GCCCGGGACG 
CCGCTCTACA ACGAGGAGGG CGGCGAGGTG GTCAAGCCCG GCGGCGACCT CGCGGCGGCC 
AGGAAGCTCC TGGCCGAGAG CGGCTACAAG GGCGAGCCGG TGACCTGCGT GGTGGCGCAG 
GACCAGCCGA TCACCAAGGC GCAGGGCGAC GTCACCGCCG ACCTGCTCAA GAAGCTCGGC 
ATGAACGTCG ACTTCGTGGC GACCGACTGG GGCACCGTCG GCGCCCGCCG CGCCTCCAAG 
GCGCCGCCCA AGGACGGCGG CTGGAGCATG TTCCACACCT GGCATGCCGG GGCGGATTGC 
CTGAGCCCGG TCGGCTACAC GGCGATCCGG GCCAACGGCG ACAAGGCGTG GTTCGGCTGG 
CCCGACAGCC CGCCGGTGGA GGCCGCGATC ACCGGCTGGT TCGAGGCGGC GACGCCGGAG 
GACGAGAAGG CCGCCATGCG CCGCCTCAAC AAGGCCGCCC TCGACTACGT GGTCTACGTG 
CCGACCGGCT TCTTCCTCAC CTACCAGGCG TGGCGGACAT CGCTGAGCGG CGTCACCAAG 
GGCCCCCTGC CCTTCTTCTG GGGCGTGTCG AAATCGGCGT GA

Protein sequence

MDRRSLLKAM AGAGALAAGP SFPAPALAQG AAKTLRFVPQ ANLANFDPIW GTQYVVRNAA 
ALVWDTLYGV DAQLRPQRQM VESETVSSDG LTWTFTLRPG LKFHDGEPVR ARDAVASLVR 
WSARDPMGLM IRAIQAELSA VDDRSFRWVL TKPYPKMLLA LAKNNAPCSF VMPERIAQTD 
PFKQITEYVG SGPMRFARDE WVPGARAVFT RFADYVPRQE PASWLAGGKQ IAFDRVEWII 
MPDPASASAA LQNGEVDWWE NPIADLVPLL KKNRNIQVDI ADPLGNVGSF RMNTLHPPFN 
NQLVRRAVLM AMNQEDYMRA IVGDDDALWK PLPGYFTPGT PLYNEEGGEV VKPGGDLAAA 
RKLLAESGYK GEPVTCVVAQ DQPITKAQGD VTADLLKKLG MNVDFVATDW GTVGARRASK 
APPKDGGWSM FHTWHAGADC LSPVGYTAIR ANGDKAWFGW PDSPPVEAAI TGWFEAATPE 
DEKAAMRRLN KAALDYVVYV PTGFFLTYQA WRTSLSGVTK GPLPFFWGVS KSA