Gene Mmar10_0142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0142
Symbol
ID	4284149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	143687
End bp	144832
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	638139607
Product	peptidase U34, dipeptidase
Protein accession	YP_755376
Protein GI	114568696
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4690] Dipeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTGACA CCCTGGTCGT CCGTGGCGGC GGCGCCGTCT GGTTCGCCAA GAATTCCGAC 
CGTGAGCCGG GCGAGGTCCA GCGGGTCGAG CGGCATGCCG CGGTCGCCGA CGACACCACT 
GAAAAGCTCG CCTGCACCCA TATCGAGATC GACCAGATCC CGGATCGTCA GGCTACCATC 
CTGTCGCGCC CGTCCTGGAT GTGGGGCGCC GAGATGGGCG TCAATGCGTC CGGCGTGGTG 
ATCGGCAATG AAGCCGTGTT CTCGCGCAAG GTGATGAAAC GGGGCAAGGC CCTGCTGGGC 
ATGGACCTTG TCCGCCTGGG ACTGGAGCGG GGCAGCTCGG CACATGAATC GGCGGCGATC 
ATCATCCATC TGCTGGAAAC CCATGGGCAG GGCGGACCGG CCGGCTGGCG CAATAAGGGG 
TTTCGTTATG ACAACAGCTT CCTGATTGCC GACGCTGCCG AGGTGCTGGT GCTGGAGACC 
TGCGGCCGCG ACTGGCGGCT GGAGCGCGTG AAACGCCACG CGGCGATCTC CAACGCCTAT 
ACCCTTGAAG GCCCGGTGAC CATGGCTTCG GAGGGAGCGC CGATCGAGGG CTTTGGCGCG 
AGTGACGAGA CCTGGCTGCG CCCGACATTA GGACGGGCCC GCGAGCGCCG GGCCTGTGCC 
CTGGCGGCGC TGGAACGCCT CGACAGGCCG GACTTTGCCA GCCTGGCGAA AATCATGCGC 
TCGCATGACC GGGGCGACGG CTTCACCAAG GGCTCCAACC GCGATCTGTG CCTCCATCAT 
GGCGGCCTCA TGCGACCCAG CCAAACGACC AATTCCATGC TGGTACGGCT GGCGCCCGGC 
GAGGCCCCGG CCGTCGCCAT GACCGGCACC AAGACACCCT GTGTCTCCCT CTTTCGCCCG 
GTGGCCTTCG ACGGTGGGTC CAGCCTGTTC TCGGACACGC TCTGGGAGCA GGGCTCAAAG 
CGCCACGACG CGCTGGCCCG CGACCCGTCA GCCCGCCAGC AGGTCCGCAA TCGCATCGCC 
GCGGCGGAGG CGCATATCCT GCCGGCCATC GAGGCCGGCC GACCGGATGT GGCGGAGGCC 
CTGGTCACGG CCTGGGATGA TCATGGACTG GATGCGGGCC GTGCCGGGAC CGAGCCGTCC 
GGCTGA

Protein sequence

MCDTLVVRGG GAVWFAKNSD REPGEVQRVE RHAAVADDTT EKLACTHIEI DQIPDRQATI 
LSRPSWMWGA EMGVNASGVV IGNEAVFSRK VMKRGKALLG MDLVRLGLER GSSAHESAAI 
IIHLLETHGQ GGPAGWRNKG FRYDNSFLIA DAAEVLVLET CGRDWRLERV KRHAAISNAY 
TLEGPVTMAS EGAPIEGFGA SDETWLRPTL GRARERRACA LAALERLDRP DFASLAKIMR 
SHDRGDGFTK GSNRDLCLHH GGLMRPSQTT NSMLVRLAPG EAPAVAMTGT KTPCVSLFRP 
VAFDGGSSLF SDTLWEQGSK RHDALARDPS ARQQVRNRIA AAEAHILPAI EAGRPDVAEA 
LVTAWDDHGL DAGRAGTEPS G