Gene Mnod_1413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1413
Symbol
ID	7308165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	1496870
End bp	1498180
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	66%
IMG OID	643599154
Product	extracellular solute-binding protein family 1
Protein accession	YP_002496715
Protein GI	220921414
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTCCT TCGATCGACG CTCGATCCTC AAGGGAGGGG CCGCCCTCGG CTTCGCCGCG 
GCCTCCGGCC TCGACGGGTT CGCGCGCGCC TGGGCGCAGG AGAACCAGTG GAAGCCGGAG 
CCCGGCGCCT CGCTCAAGCT CTTGCGCTGG AAGCGCTTCA TCCCGTCGGA GGACGAGGCT 
TTCATGCGCC TCGTCGACGC CTTCACCAAG GCGACGGGCG TGCCGGTGAG CGTCACCAGC 
GAGTCCTTCG ACGACATCCA GCCCAAGGCC TCAGTCGCGG CCAATACGGG CCAGGGTCCC 
GACATGGTCT GGGGCCTCTA CTCCTTCCCG GCCCTGTTCC CGTCGAAGTG CCTCGAGGTC 
GGCGACGTCG CGGACTATCT CGGCAAGAAA TACGGCGGCT GGGTGCCGGC GGCCGAAGCC 
TACGGCAAGG TGAAGGGCAA GTGGATCGCG ATCCCGATGG CCTTCAACGG CGGCTACATC 
AACTACCGCA TCTCGGCCGT GCAGAAGGCC GGGTTCAGCA AGGTGCCGGA GGATCTCGAC 
GGCTTCCTCG AACTCTGCCG GGCCCTGAAG AAGAACAACA CGCCGGCCGG ATTCGCGCTC 
GGCCACGCCA CGGGTGACGG CAATTCCTGG GCGCATTGGG CACTCTGGTC GCACGACGCC 
TACTTGGTCG ATGCCAACGA GAAGATCATC ATCAACTCGC CGGAAACCGC CAAGGCGCTC 
GAATACGTCA AGAACCTCTA TCAGACGTTC ATTCCCGGCA CCGTCTCGTG GAACGATTCC 
TCGAACAACA AGGCGTTCCT GTCCGGTGAG CTCTACCTGA CGAACAACGG CATCTCGATC 
TATGCCGCGG CGAAGACCGA GCGGAAGGAC ATCGCCGAGG ACATGGACCA CGCGGTCTAC 
CCGGTCGGCA AGTCCGGCAA GCCGACCGAG TTCCAGCTCG CCTTCCCGAT CCTGGCCTAC 
ACCTACACGA AGGCGCCGAA CGCCTGCAAA GCCTTCATGG CCTTCGCGCT GGAGGCGCAG 
AACTACAATC CGTGGCTGGA AGCGGCGCAG GGCTACCTCT GCCACCCGCT GAACGCCTAC 
GCCAACAACC CGATCTGGAC CGCCGACCCG AAGAACAAGG TGTTTCGCGA GGCCTCGGTC 
CGCACGCTCG CGGCGGGCGG CCTCGCCCCG GTGAGCGAGA AGGTGGCGGC CGTCCTCGCC 
GACTTCGTCG TCGTCGACAT GTTCGCCGCC TACTGCACCG GCCGCGAGGA CGTGAAGGGC 
GCCATCCGCA CGGCGGAGCG GCAGGCCCAG CGCATCTTCC GCTCGGCCTG A

Protein sequence

MTSFDRRSIL KGGAALGFAA ASGLDGFARA WAQENQWKPE PGASLKLLRW KRFIPSEDEA 
FMRLVDAFTK ATGVPVSVTS ESFDDIQPKA SVAANTGQGP DMVWGLYSFP ALFPSKCLEV 
GDVADYLGKK YGGWVPAAEA YGKVKGKWIA IPMAFNGGYI NYRISAVQKA GFSKVPEDLD 
GFLELCRALK KNNTPAGFAL GHATGDGNSW AHWALWSHDA YLVDANEKII INSPETAKAL 
EYVKNLYQTF IPGTVSWNDS SNNKAFLSGE LYLTNNGISI YAAAKTERKD IAEDMDHAVY 
PVGKSGKPTE FQLAFPILAY TYTKAPNACK AFMAFALEAQ NYNPWLEAAQ GYLCHPLNAY 
ANNPIWTADP KNKVFREASV RTLAAGGLAP VSEKVAAVLA DFVVVDMFAA YCTGREDVKG 
AIRTAERQAQ RIFRSA