Gene Mmar10_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_2106
Symbol
ID	4284533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2292142
End bp	2294397
Gene Length	2256 bp
Protein Length	751 aa
Translation table	11
GC content	63%
IMG OID	638141607
Product	peptidase S9B dipeptidylpeptidase IV subunit
Protein accession	YP_757336
Protein GI	114570656
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGTTC GCCTTGCCAG CTTTTTGGCT GTCGTCACCG CCCTCACCGC CTGCCAGCCT 
GCGCCCGAAG CGCCGGGCGA GACCGAGACT GCCGAGCCGG CGCTCACGAT CGAGCGCCTC 
CATGCCAGCC CCTCCCTGAC CGGCGCCACG CCGCGCTCGC TGACCTTCTC GCCGGACGGA 
TCGCGCGTGA CCTTCCTGCG GGCCAAGGAC GATGATGCCA GCGTGCTTGA TCTGTGGGCG 
ATGGATATCG ATGGCGGCGA GCCCTACCTT CTGGTCGATA GCCAGGTCCT CGCCCCGGAT 
GAGCGTGAAC TCACCGAGGC GGAACGCCAG CTGCGCGAGC GGGCTCGAAT CTCCTCGACC 
GGCATCGTGC GCTATGACTG GGACAGCCAG GGCGAGGCCA TACTGGTGCC GCTGGACGGC 
GATGTGTTCC ATGTCGATGT GGCGACCGGG CAAGCGCGCC GCCTGATGGA AACACCGGAA 
TACGAGACCG ACGCCCGCAT CTCCCCGCGC GGCAATTTCG TGTCCTTTGT GCGCGAACAA 
AATCTATACG TCATCGATCT GGAAAGCGGT GAAGAGACCG CCATCACCTC TGAAGGCGGC 
GGCCTGGTCT CCTTCGGCAT GGCGGAATTC GTTGCCCAGG AAGAGCTTGG ACGCCGGACC 
GGCTATTGGT GGTCACCGGA CGAGCAATAC ATCGCCCTCG CCCGCGTCGA TGAAAGCCCG 
GTCGACAATA TCCAGCGCAT GGAAATCGGC GCCGACGGCT CGGCCCGGGT TGTCGACCAG 
CGCTATCCGC GCGCCGGGAC TGACAATGCG ATCGTCGAGC TGTTCATCGC CGAGCGCGCG 
ACCGGGACAC GCCGCCAGGT CGAGCTGGCG CAGACCGACG ACATCTACCT CGCCCGCGTC 
AATTGGGCCT CCGACAGCGC TACGGCCTAT GTCCAGGTGC TCAACCGGAT GCAGGACCAG 
CTCACCATCC TGACCGCTGA TCCAGCGACC GGCGAGGCCG CTCCCTGGCT GGTTGAAAAC 
ACCGATATCT GGATCAATCT GACCAATGAT TTCCGCGCCC TGTCTGATGG CACGGTCCTG 
TGGACCAGCG AGGACACGCC GGGTGGTTTC CGTCACATCC AGCACCGCGC CGCCGATGGC 
AGCCTGATCA ATCAGGTCAC CTCGGGTGAC TGGGTGGTCG GCAGTATCAA TTCAGTCGAT 
ATGGACAACA GCCTGGTCTA TTTCACCGGC TGGATCGAGA CGCCGCTGGA ACGACACATC 
TATTCGGTGC CATTGGACGG CTCGGCCGCT CCGACGCGGA TCACGTCGGG TGATGGTCGC 
TGGTCGGCTC GCTTCGGACG TGATGCGACA CGCTTCATCG GCACTTATTC CGACCCGCAA 
ACCCCGCCGC AGACCGCCCT CTATGCGGTC GACGGAAGCC GCATTCGCTG GATCGAGGAA 
AACGCCCTGG TCGAGGGACA TCCGTATGCC CCCTATCTCG ACGATCACAT CACGCCGCAA 
TACGGCACGC TGACGGCCGC AGACGGGACC GAGCTGCACT ACCAGATCTT CCTGCCGGCC 
GATTTTGATC CGAACCGGCA ATACCCGGCG ATCCAGTATC TTTATGGCGG CCCGCACAGC 
CAGCAGGTCC ACCGCGGCTG GCAATCGCTG CGGGCGCAGA TGTTCGCCCA GCGCGGCTAT 
GTCTATTTCA CCATCGACAA CCGCGGCTCA TGGAATCGCG GACGTGAATT CGAGGGGCAG 
TTGCGCCATC GCATGGGCTC GGTCGAGGTC GAGGACCAGC TGGTCGGGCT GGACTATCTC 
AAGAGCCTCG ACTTCGTCGA TGCGGATCGC GTCGGCATTT GGGGCTGGTC CTATGGCGGC 
TACATGACGC TGATGGCGAC CTTGCAGGCA CCGGACGCCT GGGCAGCGGG CGTTGCCGGA 
GCACCGGTTA CCGACTGGAC GCTGTATGAC ACCGCCTATA CCGAGCGCTA CATGGGTCAC 
CCGGACGCCA ATTTCGACGG CTATGAGCAA TCCTCGGTCT TCGCCCATCT GGACAGTTAC 
GAGACCCCGC TCCTGCTGAT CCACGGCATG GCCGACGACA ATGTCATCTT CGCCAATTCG 
GTCCGGCTCT ATTCGGAACT CCAGCAGCAA CGCGCCGATT TCGAAATGAT GACCTATCCC 
GGCCAGCGCC ACGGCGTACG CGGCGAGGAC CGGTCGGTCC ATCTGTGGAC GATGATCGTG 
AACTATTTCA ATCACCAGCT GAAGGATGAG GGGTAG

Protein sequence

MSVRLASFLA VVTALTACQP APEAPGETET AEPALTIERL HASPSLTGAT PRSLTFSPDG 
SRVTFLRAKD DDASVLDLWA MDIDGGEPYL LVDSQVLAPD ERELTEAERQ LRERARISST 
GIVRYDWDSQ GEAILVPLDG DVFHVDVATG QARRLMETPE YETDARISPR GNFVSFVREQ 
NLYVIDLESG EETAITSEGG GLVSFGMAEF VAQEELGRRT GYWWSPDEQY IALARVDESP 
VDNIQRMEIG ADGSARVVDQ RYPRAGTDNA IVELFIAERA TGTRRQVELA QTDDIYLARV 
NWASDSATAY VQVLNRMQDQ LTILTADPAT GEAAPWLVEN TDIWINLTND FRALSDGTVL 
WTSEDTPGGF RHIQHRAADG SLINQVTSGD WVVGSINSVD MDNSLVYFTG WIETPLERHI 
YSVPLDGSAA PTRITSGDGR WSARFGRDAT RFIGTYSDPQ TPPQTALYAV DGSRIRWIEE 
NALVEGHPYA PYLDDHITPQ YGTLTAADGT ELHYQIFLPA DFDPNRQYPA IQYLYGGPHS 
QQVHRGWQSL RAQMFAQRGY VYFTIDNRGS WNRGREFEGQ LRHRMGSVEV EDQLVGLDYL 
KSLDFVDADR VGIWGWSYGG YMTLMATLQA PDAWAAGVAG APVTDWTLYD TAYTERYMGH 
PDANFDGYEQ SSVFAHLDSY ETPLLLIHGM ADDNVIFANS VRLYSELQQQ RADFEMMTYP 
GQRHGVRGED RSVHLWTMIV NYFNHQLKDE G