Gene Mmar10_0463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0463
Symbol
ID	4284152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	539292
End bp	540287
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	71%
IMG OID	638139926
Product	peptidase S58, DmpA
Protein accession	YP_755694
Protein GI	114569014
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAATGC CAGCACCGCG AAACAGCCTG ACCGATATCG CCGGTCTGCG CGTCGGACAG 
GTTCATGATG CCGCCGTCCG GACGGGCGTG ACGGTCATTT TGCCGGACCA GCGAGCCGTC 
TGTGCGGTCG ATGTGCGCGG TGGCGGGCCG GGCACGCGCG AGACCGATGC GCTGGCCAGC 
CACACCCTGG TCGATGCCGT CGACGCGATC GTCCTGTCCG GGGGCTCGTC CTACGGGCTG 
GCGGCCGCAG ACGGGGTTGC GGCGGCGCTG GGCGCCCGTG GTGACGGTTT TGCCCTGTTC 
GACATGCCGG GCGTGCCCAA ATCCCCGGTC GTGCCCTCGG CCATCCTCTA TGATCTCGCC 
AATGGCGGCG ACAAGGCCTG GGGCGAGGAG CCGCCCTATC GGGCACTTGG CAAGGCGGCG 
CTGGCGGCCG TCTCGGACAC GGTCGAGCTT GGGGCTTTCG GCGCCGGACA CGGGGCCCGC 
GCCGGCCTGC ATGCCGGCGG CACAGGCACG GCCAGCCTCG ACCTTTCCGG CGAAGGCGGG 
CGGGTCGCGG CGCTGGTCTG CGTCAACAGT TTCGGCTCGG TGACGCTGCC CGGCGCTGAC 
GATGTCTACT GGGCCTGGCC ATACGAGATA GATGGCGAGT TCGGCTGTGG TCGTCCGCCA 
GCCGACTGGC GTCCGGCCCC GGAAGACTGG GGCGCGGCCA AGATGCAGCC CGGACCGCGT 
GAAAACACCA CCATCGCCGT CGTCGCCACC GACATCGCGC TGACGCCGGC CCAGGCCAAG 
CGCCTCGCCA TCATGGCCCA GGACGGGCTG GCCCGCGCCA TCCGCCCGGT CCACACACCC 
TTTGACGGGG ATGTGGTCTT TGCCCTCTCA ACCGCCGCCC GGCCGCTGGG CAAGGACGGC 
GAAGTACAAC TCGCCCGGCT CGGTTCGGCC GCCGCCGACT GCCTCGCCCG CGCCGTCGCC 
CGCGGCGTCC ACGCGGCCCG TCTGGCAACC GGTTGA

Protein sequence

MSMPAPRNSL TDIAGLRVGQ VHDAAVRTGV TVILPDQRAV CAVDVRGGGP GTRETDALAS 
HTLVDAVDAI VLSGGSSYGL AAADGVAAAL GARGDGFALF DMPGVPKSPV VPSAILYDLA 
NGGDKAWGEE PPYRALGKAA LAAVSDTVEL GAFGAGHGAR AGLHAGGTGT ASLDLSGEGG 
RVAALVCVNS FGSVTLPGAD DVYWAWPYEI DGEFGCGRPP ADWRPAPEDW GAAKMQPGPR 
ENTTIAVVAT DIALTPAQAK RLAIMAQDGL ARAIRPVHTP FDGDVVFALS TAARPLGKDG 
EVQLARLGSA AADCLARAVA RGVHAARLAT G