Gene Mnod_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_2023
Symbol
ID	7305212
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	2122280
End bp	2123527
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	66%
IMG OID	643599757
Product	Extracellular ligand-binding receptor
Protein accession	YP_002497312
Protein GI	220922011
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGAAC AGGGAACGCG CCAGGGCTCC GTCTCGCGCC GGATGCTCGT GCGCGGCATG 
GCCGCCACTG GCGCGCTCGC CGGCATCGGC ATGCCTTTCG TCGCGCGCGC GGCTGAGCCG 
ATCCGCATCG GCTTCCCGAC GCCGGTCACC GGCCCGTTCG GCGCCGAAGC CAAGGATCAA 
ATCCGCTCCG CCGAACTCGC CGTGAAGCAG TTCAACGAAG CGGGTGGCGT GAACGGACGG 
ACGGCCGAGC TTCTAGTCCG CGACGACAAG CTCAATCCCG GCGAGGCCGC GACCCGGACG 
CTAGAGCTCA TCGAGAAGGA CAAAGTCCAC TTCATCGTAG GCGCGCTTTC GAGCGCGGTC 
CAGCTTTCCG TCAACGAGAT CACCCGCTCG CGCAAGGTCC TCTATGTGTC GATCAGCCAG 
TCTGACACGA TCAACGAGGC CAAAGACTTC AGCCGCTACA CCTTCCACGA GGCGCTGAAC 
CCGCACATGA CCACCGCGGC GGTGGCCAAG CACGCGTTCA AGAAGGGCAC CAAGGTCGCA 
TACCTGGCCG CCGACTATGC CTACGGCCAC GAGATGCTGC GCGGCTTCAA GCGCGCGGCG 
GCCGCCATTG GCGCCGAGAC GGTCGGCGAG ATCCTGCACC CGTTCGGCGC GCCCGACTAC 
TCGACCTTCA TGCCTCGGCT GCGCTCCATG CGCCCCGACA TCCTGTGCAT CTGCAATTTC 
GGCCGCGATC AGGCCAATAG CATCAAGCAG GCCAGCGATT TCGGGTTGAA GAAGGGCGCC 
CAGATCGTCG TCCCGGTTCT GCTGCACAAC CAACGCCTCG CCGGCGGCGC CGACGCCTTC 
GAAGGCGTGG TAGGGGCCAG CAACTACTAC TGGCGCCTTG AGGAGACCGT CCCGTCGGCA 
AAAGCCTTCA ACGACGCCTT CCGGGCCGCC TACGCCGACG CGATCCCGAC CGATTACGGC 
GCCTACGGTT ACACCGCCGT TCGCTCACTG CTGATGGCGG TGAAAGCGGC CGGCGACACC 
GACACCGACA AGGTCATCGC GGCGTTGGAG GGACTGACAT ACGACGTCGC CAAGGGCCCG 
GAGCGCTACC GCGCCTGCGA CCACCAGGCG ATCCAGTCCG TGCTCATCAC CGTATCCAAG 
AAAAAGTCCG AGATGCAGGG CGAGGCGGAC CTTTTCCGGA TCCTGGAGGT CGAGGCGGGC 
TCCGAGAACG CGCTCCGCAC CTGCAACGAA CTCGGTCACC GCGCCTGA

Protein sequence

MIEQGTRQGS VSRRMLVRGM AATGALAGIG MPFVARAAEP IRIGFPTPVT GPFGAEAKDQ 
IRSAELAVKQ FNEAGGVNGR TAELLVRDDK LNPGEAATRT LELIEKDKVH FIVGALSSAV 
QLSVNEITRS RKVLYVSISQ SDTINEAKDF SRYTFHEALN PHMTTAAVAK HAFKKGTKVA 
YLAADYAYGH EMLRGFKRAA AAIGAETVGE ILHPFGAPDY STFMPRLRSM RPDILCICNF 
GRDQANSIKQ ASDFGLKKGA QIVVPVLLHN QRLAGGADAF EGVVGASNYY WRLEETVPSA 
KAFNDAFRAA YADAIPTDYG AYGYTAVRSL LMAVKAAGDT DTDKVIAALE GLTYDVAKGP 
ERYRACDHQA IQSVLITVSK KKSEMQGEAD LFRILEVEAG SENALRTCNE LGHRA