Gene Mnod_3421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_3421
Symbol
ID	7308786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	3541119
End bp	3542339
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	643601095
Product	ABC transporter substrate-binding protein
Protein accession	YP_002498639
Protein GI	220923337
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCGC GGTCACGCTT CTGTGCCCTG ATGGCTCTGA TGCTGGGGTC GAGTGCAGTC 
CAGGCCCAGA TCTCCGACAA CGTGGTCAAG ATCGGCGTGC TCTCCGATAT GAGCGCCGGC 
CAATCCGACA GCACGGGACC GGGATCGGTG GTGGCGGCCC GCATGGCTGT CGAGGATTTC 
GGCGGAAAGG TGCTGGACCA GCCCATCGAG GTCGTCTCGG CCGATCACCA GAACAAACCC 
GATGTGGGTT CGAACATCGT CCGGCAATGG CTGGAGCGAC AGCAGGTCGA CGTCGTCGCC 
GACGTCCCGA CCTCGTCGGT TGCGCTCGCG GTCCAGACGC TCACGCGGGA GCGCGACCGC 
ATCTTCCTGA ACTCCTCGGC AGGCTCGTCC GACCTGTCCG GACCGGCCTG CTCGCCCACG 
GCGATCCACT GGACCTACGA CACCTACTCC CTGGCCAATG GGACGGCCGG TCCCCTCGTC 
AGCCAAGGCG CGGATACGTG GTACTTCATC ACGGCCGACT ACGCCTTCGG CCATGCCCTC 
GAACGCGACA CGAGCCAGGC CGTGACGCGG AACGGCGGCA AGGTCTCGGG CACCGTGCGG 
CATCCTATGG GCATGGCCGA CTTCTCCTCG CCCCTGCTGC AGGCGCAGGC CTCGCAGGCG 
AAGGTGATCG CACTGGCCGA TCCCGTCGGC GACACCGCCA CGGCGGCCAA GCAGGCCGGC 
GAGTTCGGCA TCCAGGTGCA GGGCCAGAAG CTCGTGGGCC TGCTCATCGA CGTCGTCGAC 
CTGCGGGCGA TCGGGCTTCC CATCGCCCAG GGCATGCTGC TGACGACCTC GTTCTACTGG 
GACCGGGACG ACGAGACCCG AGCCTTCGCG AAGCGCTTCT TTGACCGCCA CAAGCGCATG 
CCGACCCAGT TCCAGGCCGG CGTGTACTCG AGCATCATGC ACTACCTCAA GGCCGTGCAG 
GCGGCAGGAA CCGACGAGGC GAAGGCCGTC GTCGCGAAGA TGCGGGAGAT GCCGGTCAAC 
GACTTCTTTG CCCGGAACGG CAGGCTGCGC GAGGACGGTC GCATGGTTCA CGACATGTAC 
CTCATGCAGG TCAAATCGCC GGCCGAGTCG AAGGGCGAGT GGGATCTGCT CAAGCTCGTG 
CAGACGATCC CGGGCGAGCG GGCCTTTCGC CCACTCGATG CCGGCGGCTG CCCCTTGGTC 
GCCAAGGACC GGAAAGACTA G

Protein sequence

MKARSRFCAL MALMLGSSAV QAQISDNVVK IGVLSDMSAG QSDSTGPGSV VAARMAVEDF 
GGKVLDQPIE VVSADHQNKP DVGSNIVRQW LERQQVDVVA DVPTSSVALA VQTLTRERDR 
IFLNSSAGSS DLSGPACSPT AIHWTYDTYS LANGTAGPLV SQGADTWYFI TADYAFGHAL 
ERDTSQAVTR NGGKVSGTVR HPMGMADFSS PLLQAQASQA KVIALADPVG DTATAAKQAG 
EFGIQVQGQK LVGLLIDVVD LRAIGLPIAQ GMLLTTSFYW DRDDETRAFA KRFFDRHKRM 
PTQFQAGVYS SIMHYLKAVQ AAGTDEAKAV VAKMREMPVN DFFARNGRLR EDGRMVHDMY 
LMQVKSPAES KGEWDLLKLV QTIPGERAFR PLDAGGCPLV AKDRKD