Gene Mmwyl1_3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmwyl1_3074
Symbol
ID	5365320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Marinomonas sp. MWYL1
Kingdom	Bacteria
Replicon accession	NC_009654
Strand	-
Start bp	3485255
End bp	3486865
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	43%
IMG OID	640805446
Product	extracellular solute-binding protein
Protein accession	YP_001341919
Protein GI	152997084
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0483936
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGATG ACAAAAAACG TTCGTTGGGA GAAAAACAAA GTTCAAGTCT GTTAACGCAG 
GGCGTATCCC GACGTCAGGT TTTGCGTGGA ATGATGACAA CTGGGGTAGT GGCAGCTGGC 
TCAGGCGTAT TAGTACCAGG CTCCTCACTA TCTTTTGCTA AATCCTCCGC TGGTGTGTAC 
GGCGGTAAAG TCAAAGTCGC TAGTCAGTCA GGTTCCACGG CAGATACCTT GGATCCGGCT 
AAAGGATCGG GCTCTACTGA TTACACCCGC CATTATATGT TTTATAACGG ACTCACTCGG 
TTAGATGAAA GCTTGGTACC TCAAATGGTG TTAGCGGAAT CATTTGATAC GAAAGATGCT 
GAAAAATGGG TCATTAAGCT CCGCAAAGAT GTTAACTTTC ATGATGGTAA GCCTTTCACA 
TCAGCTGATG TTGTGTACTC GTTTAATCGT CATAAAGACC CAAAAACCAG CTCTAAAGTT 
GAGAGTGTTG CTAAGCAAAT GGTCGAGGTT AAAGCTGTAG GACCTCACGA AGTTCATATC 
ACTTTACAAA CTAAAAATGC TGATTTGCCC GCTATTCTAG CTGTGTCTCA TTTTCTGATT 
GTTCGTGATG GCACAACAGA CTTCAAAAAA GCCAATGGAA CTGGGGCATT TATTTGTCAG 
GAGTTCCAGC CAGGTATTCG TTCTATCGGC ACTCGTAATC CAAATTATTG GAAAAAAGGT 
CTTCCGTATT TAGACGAAGT AGAGCTGTTC TCTATTCCAG ATGAGTCTGC TCGCGTCAAT 
GCGCTTTTGT CTGGCGATGT GCATTTGATA AACTCAGTCA ATCCGCGCTC TATTAACACC 
CTAATGGAAA ACCCAATTGC ACGAGTAATA CAGACGGATT CTGGTGGTTA TACCAATTTG 
GTAATGAGAG AGCAGCTTGG TCCTGTGCAA AATCCTGATT TTGTTTTAGG CATGAAATCG 
ATTCTAAATC GCCCGCAAAT TATAAATGTG GCTTGTCGTG GCTTTGGCAC AATTGCTAAT 
GACCAACCAA TTCCAAAAGG CCACCGTTAT TACAACAGCG GATTAGCACA GCGAGAATTT 
GATCCAGATA AAGCGAAGTA TCATTTCAAA AAAGCTGGAG TGTTAGGCCA AAGTATCCCT 
ATGGTAGCGT CCGCTGCGGC GGATAATTCC GTTGAAATGG CCCAAATAGT GCAATTGTCA 
GCTCAACAAG CTGGGCTTAA ATTGGATATA AAACGAGTTC CAGCAGACGG TTATTGGTCC 
AATCATTGGA TGAAAGATCC CTTAGGCTTT TCAAATATTA ATGCGCGACC CACGGCTGAC 
CTGATTTTTA GTTTGTTCTA TCAATCAAGC TCAAACTGGA ATGAATCGGG TTGGAAAAAT 
GAACAGTTTG ATCAGCTGTT GATTGCGGCA CGTGGAGAGA TGGATGAGGC CAAACGCAAG 
CAAATGTATG GCGATATGCA GGTTTTAGTT CATGATCATT GCGGTATTGG TATTTCCAAT 
TTTAATAGTA TCAATGATGC CTGTAACAGT AAGTTAGGAG GATATACCCC TCACCCAATA 
GGTGGTTTCA TGGGGTACAT GTTTGCAGAA CAAGTTTGGC TAGAAGTTTA A

Protein sequence

MKDDKKRSLG EKQSSSLLTQ GVSRRQVLRG MMTTGVVAAG SGVLVPGSSL SFAKSSAGVY 
GGKVKVASQS GSTADTLDPA KGSGSTDYTR HYMFYNGLTR LDESLVPQMV LAESFDTKDA 
EKWVIKLRKD VNFHDGKPFT SADVVYSFNR HKDPKTSSKV ESVAKQMVEV KAVGPHEVHI 
TLQTKNADLP AILAVSHFLI VRDGTTDFKK ANGTGAFICQ EFQPGIRSIG TRNPNYWKKG 
LPYLDEVELF SIPDESARVN ALLSGDVHLI NSVNPRSINT LMENPIARVI QTDSGGYTNL 
VMREQLGPVQ NPDFVLGMKS ILNRPQIINV ACRGFGTIAN DQPIPKGHRY YNSGLAQREF 
DPDKAKYHFK KAGVLGQSIP MVASAAADNS VEMAQIVQLS AQQAGLKLDI KRVPADGYWS 
NHWMKDPLGF SNINARPTAD LIFSLFYQSS SNWNESGWKN EQFDQLLIAA RGEMDEAKRK 
QMYGDMQVLV HDHCGIGISN FNSINDACNS KLGGYTPHPI GGFMGYMFAE QVWLEV