Gene Mmar10_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1646
Symbol
ID	4284232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	1803792
End bp	1805162
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	62%
IMG OID	638141133
Product	peptidase M28
Protein accession	YP_756876
Protein GI	114570196
COG category	[R] General function prediction only
COG ID	[COG2234] Predicted aminopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0104319
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.645217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTCG TGACCGCCGC ATCCATGGCC ATCCTGTTGG CCACACCGGC ACTGGCCCAG 
CAACACGCGC CGCCGTCTGA AGTCCTCGCC GTCCACGATC ATGTCGCGGC CGTTTCGGCC 
GACCGGATCG AAGCCGATAT TCGCACCCTG GCCGAATTCG GGACCCGCCA CACCCTGTCA 
GAGACCGAGA GCGACACCCG CGGTATTGGC GCCGCCCGGC GCTGGATATT CGACGAATTC 
GAACGCATTT CCGCCGAGTG CGGTGGCTGT CTGGAAGTCA TGTATATCTC CGACACGATT 
TCCGGCACGG CGCGAATTCC TGACCCGGTA GAGGTGGTCT CGGTCGTGGC TATCCAGCGC 
GGCCGGATTG ATCCGGACCG GTATGTGGTG ATGTCAGGCG ATATCGACAG CCGTGTGACC 
GACCCTCTGG ATGGCACCTC CGACAGCCCA GGCGCCAATG ACAATGCGTC CGGCATGGCC 
GGCGTGATCG AAGCGGCCCG CGTACTCAGC CAGCACCAGT TTGACGGGTC CATCATGTAT 
GCAGGCCTGT CGGGCGAAGA GCAGGGCCTG TTTGGCGGTC AGATCGTGGC CGCTCACGCC 
ATCGAGAATG GCTGGCGGAT CAAGGGTGTG CTCAACAACG ACATGATCGG CAATATCGCC 
GGTATCAATG GAGTCATCAA CAATACCACC GCCCGTGTTT TCTCCGAGGG CACACGCGCG 
GTCGAGACGC CTGAGGAAGC GCGCACCCGA CGCTTCACCG GTGGTGAGGT CGACAGCCCG 
TCGCGCAATC TGGCCCGTTT CGTCGACCGG ACGGCGGACC AGTACATTCC CAATCTCGAT 
GTGATGATGG TCTACCGGCT CGATCGTTTC GGGCGCGGCG GCCACCACCG CCCGTTCAAT 
GCGGTCGGCT ATCCCGGTGT CCGCATCATG GAGACCAATG AGCATTATGA CCGCCAGCAT 
CAGGATTTGC GGGTTGAGGA TGGTCGTCCC TATGGCGACA CGATTGATGG TGTGGACTTT 
GATCATGCCG CGCGTCTGAC GGCCCTCAAT GTCGCCGTCA TGGCGCAGAT GGCGGGCGCG 
CCGCCATTTC CCGCCAATGT CACGATTGAG GGCGCTGTGC GTCCCTCAAC GACGTTAAGC 
TGGAATGCGG CTGAAGGTGA TGCGGCCAGT AATCTGGCCG GCTACCGCGT CTATTGGCGC 
CTGACCGACC AGCCGCAATG GCAGTGGAGC CGCTTTGTCG GCATCACCGA CACGTTCACG 
CTCGAGAATG TGGTGATCGA CAACTATTAT TTCGGTGTTT CAGCGGTCGC GCTGGACGGC 
TCGGAAACAC CGGTTGTCTT CCCCGGCGCG GCCGGTTCAT TCGGCAATTG A

Protein sequence

MKFVTAASMA ILLATPALAQ QHAPPSEVLA VHDHVAAVSA DRIEADIRTL AEFGTRHTLS 
ETESDTRGIG AARRWIFDEF ERISAECGGC LEVMYISDTI SGTARIPDPV EVVSVVAIQR 
GRIDPDRYVV MSGDIDSRVT DPLDGTSDSP GANDNASGMA GVIEAARVLS QHQFDGSIMY 
AGLSGEEQGL FGGQIVAAHA IENGWRIKGV LNNDMIGNIA GINGVINNTT ARVFSEGTRA 
VETPEEARTR RFTGGEVDSP SRNLARFVDR TADQYIPNLD VMMVYRLDRF GRGGHHRPFN 
AVGYPGVRIM ETNEHYDRQH QDLRVEDGRP YGDTIDGVDF DHAARLTALN VAVMAQMAGA 
PPFPANVTIE GAVRPSTTLS WNAAEGDAAS NLAGYRVYWR LTDQPQWQWS RFVGITDTFT 
LENVVIDNYY FGVSAVALDG SETPVVFPGA AGSFGN