Gene M446_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3643
Symbol
ID	6133365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4061946
End bp	4063136
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	69%
IMG OID	641643810
Product	response regulator receiver protein
Protein accession	YP_001770458
Protein GI	170741803
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0163627
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCGA TCGGCAGGGT CGCGATCCAG GGTCTCGGGG CCTGTCTCCT CGCCGCCCTC 
CTCACGGCGC CGGCCCGCGC CGAGCCGGGC GAGGACGGCA AGCTGCGCGT CGGCCTGATG 
TTCACCCTGA GCGGCCCCTC GGCGGTGCTC GGCGAGCAGG GGCGCGACGG GTTCCTGCTC 
GCGCTCGAGA CCATGGGCCG GAAGCTCGGC GGCCTCGACA CCGAGGTGCT GGTGGTCGAC 
GACGAGCTCA AGCCCGACGT CGCCGCCAAC CGGGCGCGGG ACTTCGCGCG GCGCGACCGG 
GTCGATTTCG TGGTCGGCCC GACCTTCTCG AACGTGCTGC GGGCGATCGT GCGGCCGGTC 
ACCGAATCGG GCGCCTTCCT GATCAGCCCC AATGCCGGCA CCTCGAACTA CGCCGGGTCC 
GAGTGCAACC CGAACCTGTT CGTCTCCTCC TACCAGAACG ACCAAGTCCA CGAGGTCCTG 
GGCAAGGTCG CGCAGGACAA GGGCTACAAG CGCCTCGTCC TCCTCGCCCC GAACTACCAG 
GCCGGCAAGG ATTCGCTGGC CGGCTTCAAG CGCTCCTACA AGGGCGAGGT GGTGAGCGAG 
ATGTTCACCC CGCTGGGCCA GCTCGACTTC TCGGGCGAGC TGGCGCAGAT CGCGGCCGCC 
AGCCCGGACG CGGTCTTCGC CTTCATGCCG GGCGGCATGG GCGTCAATCT CGTGCGGCAG 
TACCGGCAGG CGGGCCTCGC CCAGATCCCG TTCCTCTCCG CCTTCACGGT CGACGAGAGC 
ACGCTGCCGG CCCAGAAGGA CGCCGCGGTC GGCTTCTACG GCGGCGCCAA CTGGGCGCCC 
GACCTCGACA ACCCGCAATC CAAGGCCTTC GTGGCCGCCT ACGAGAAGGC GTATGGCCGC 
GTGCCCGGCA CCTACGCCAT GCAGGCCTAC GACGCCGCCC AGATGATCGA CAGCGCCGTC 
AGGGCCGCCA AGGGCAACCT GAAGGACAGG GACGCGCTGC GCGCCGGCCT CAAGGCGGCC 
GAGTTCCCGT CGCTGCGCGG CCGATTCCGG ATCGGCAACA ACCACTTCCC AATCCAGGAC 
TTCTACCTCG TCCGCGCCGC CAAGCGCCCC GACGGCAAGT ACGAGACCCA AATCGTCGAG 
AAGATCTTCT CGGACTACCG CGACGCCTAC GCCGCCGAGT GCAAGATGTG A

Protein sequence

MKPIGRVAIQ GLGACLLAAL LTAPARAEPG EDGKLRVGLM FTLSGPSAVL GEQGRDGFLL 
ALETMGRKLG GLDTEVLVVD DELKPDVAAN RARDFARRDR VDFVVGPTFS NVLRAIVRPV 
TESGAFLISP NAGTSNYAGS ECNPNLFVSS YQNDQVHEVL GKVAQDKGYK RLVLLAPNYQ 
AGKDSLAGFK RSYKGEVVSE MFTPLGQLDF SGELAQIAAA SPDAVFAFMP GGMGVNLVRQ 
YRQAGLAQIP FLSAFTVDES TLPAQKDAAV GFYGGANWAP DLDNPQSKAF VAAYEKAYGR 
VPGTYAMQAY DAAQMIDSAV RAAKGNLKDR DALRAGLKAA EFPSLRGRFR IGNNHFPIQD 
FYLVRAAKRP DGKYETQIVE KIFSDYRDAY AAECKM