Gene Mnod_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1603
Symbol
ID	7303364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	1684956
End bp	1686575
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	69%
IMG OID	643599337
Product	extracellular solute-binding protein family 5
Protein accession	YP_002496896
Protein GI	220921595
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.654936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGT TCTCCCTCTC CCGCCGCCAG TTCGTGGCCG GCGCCGCGGC GCTCACGGCG 
ATGGGGCCGA CCGGGTCCGC GCTCGCCGCA GGGCCACCGT CCGGCAGCCT GACCTACGGC 
ATTTCGATGT TCGACCTGCC CCTTACCACC GGGCAGCCGG ACCGGGGGGC GGGTGGCTAC 
CAGTTCACCG GGCTCACCCT CTACGACCCA CTGGTGGCCT GGGAACTCGA TGTCGCCGAC 
CGGCCCGGCA GACTGATCCC GGGCCTTGCC ACCTCCTGGG AGAGCGATCC CGCCGACCGG 
AAGAACTGGA CCTTCCGCCT GCGCGAGGGC GTGACGTTCC ACGACGGCTC CGTCTTCGAC 
GCGGATGCGG TGATCTGGAA TTTCGAGAAG GTGCTGAACG ACAAGGCCCC GCATTACGAC 
CAGCGGCAGG CCTCGCAGGT GCGCCCGCGC CTGCCCTCGG TCGCCTCCTA CAGGAAGCTC 
GACGCCATGA CAGTGCAGGT CACCACCAAG GCGGTCGACG CGCTGTTCCC CTACCAGATG 
CTGTGGTTCC TGGTCTCCTC GCCAGCGCAG TACGAGGCGG TGGGCCGCGA CTGGACCAAG 
TTCGCCTTCC AGCCTTCCGG CACCGGCCCC TACCGCATGG GCCAGCTCGT GCCGCGGGTG 
CGGCTCGAAC TCGTCCCGAA CGAGACCTAC TGGAACCCCA GGCGGATGCC GAAGCTCGCC 
AGGCTCACGC TGACCTGCAT CCCCGACAAT CTCGCGCGGG TCAACGCGCT CCTCAGCGGC 
GACGTCGACC TCGTGGAGCT GCCCGCGCCC GATGCGGTGC CGCACCTCAA GGCGGCGGGC 
ATGCGGGTGA CCGGCAACGA CACGCCGCAT GTCTGGAACT ACCATCTGTC GATGCTGGAG 
GGCAGCCCGT GGCGCGACCT GCGCCTGCGC AAGGCGGCCA ACCTCGCCAT CGACCGCGAG 
GGCGTGGTCG CGCTGATGGG TGGCCTCGCC ACCCCGGCAG TGGGCCAGGT GCAGCCGTCG 
AGCCCCTGGT TCGGCAAGCC CTCCTTCAAG ATCGGCTACG ACATCGACAC CGCCCGCAAG 
CTGATGCGGG AGGCGGGCTA CTCCCCCCAG AATCCGTTGC GCACCAGGTT CATCATCCCG 
ACCGGCGGCT CGGGCCAGAT GCTGTCGCTG CCGATCAACG AGTTCGTGCA GAGTAGTTGG 
GCCGAGATCG GCATCGCGCT GGAGTTCCAG CCGGTGGAGC TGGAGGTGGC CTACACGGCG 
TGGCGCCAGG GCGCAGCCGA CCCGTCGCTC AGGGGCGTGA CCGGCGGCAA CATCGCGTAT 
GTCACCTCCG ACCCGCTCTA CGCGATCCTG CGCTTCTACA GCTCGAAGCA GATCGCGCCG 
ACCGGCGTGA ACTGGAGCCA CTACCGGAAC CCGGAGGTGG ATGCCCTCTG CGAGTCGATC 
CAGGCGAGCT TCGACCCCGC CGAGCAGGAT CGGATGCTCG CCCGCATCCA CGAGATCGTG 
GTGGACGACG CGGTGCAGGT CTGGGTGGTG CACGACACCA ACCCGCACGC CCTCGCGGCC 
AAGGTGAAGG GCTACACCCA GGCCCAGCAC TGGTTCCAGG ACCTCACCAC CTTGGCCTGA

Protein sequence

MSQFSLSRRQ FVAGAAALTA MGPTGSALAA GPPSGSLTYG ISMFDLPLTT GQPDRGAGGY 
QFTGLTLYDP LVAWELDVAD RPGRLIPGLA TSWESDPADR KNWTFRLREG VTFHDGSVFD 
ADAVIWNFEK VLNDKAPHYD QRQASQVRPR LPSVASYRKL DAMTVQVTTK AVDALFPYQM 
LWFLVSSPAQ YEAVGRDWTK FAFQPSGTGP YRMGQLVPRV RLELVPNETY WNPRRMPKLA 
RLTLTCIPDN LARVNALLSG DVDLVELPAP DAVPHLKAAG MRVTGNDTPH VWNYHLSMLE 
GSPWRDLRLR KAANLAIDRE GVVALMGGLA TPAVGQVQPS SPWFGKPSFK IGYDIDTARK 
LMREAGYSPQ NPLRTRFIIP TGGSGQMLSL PINEFVQSSW AEIGIALEFQ PVELEVAYTA 
WRQGAADPSL RGVTGGNIAY VTSDPLYAIL RFYSSKQIAP TGVNWSHYRN PEVDALCESI 
QASFDPAEQD RMLARIHEIV VDDAVQVWVV HDTNPHALAA KVKGYTQAQH WFQDLTTLA