Gene Mmar10_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1858
Symbol
ID	4284740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	2026234
End bp	2027505
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	638141357
Product	hypothetical protein
Protein accession	YP_757088
Protein GI	114570408
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0460852
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAATCA AGCTGGACCT CAATCCGGAA GAGCGCGCCG TACTCGATTG GATCGATACG 
CGGGCTGACG GCATGATCAA GACCGCAAAG GCCTGGTCTG CCATAAACTC GGGCAGCCGC 
AACGCCGATG GCCTCGAAGC CATGCGGGCT GAGCTGGAAA CGGCCTTTGC GGCGACCGGT 
GGCGAAATCA GCGCGATCGA GCTGCCGCCA ACGACCGTCG TCGACCCGGA CGGCACGGTG 
CGCGAGCAGG CTTTCACGCC AGCCTTCCAT TGCCGGATCC GGCCGCAAGC GCCGATCCGC 
ATTGTCATGA CCGGACATCA CGACACGGTT TTTCCGGCGG ATAGTCATTT CCAGGCCACC 
GAACTTTGGG ATGACGACAC GCTCAACGGC CCCGGAGTTG CCGACATGAA GGGCGGCATC 
CTGGTGATGC TGCACGGTAT TCTCGGCCTC GAGCGTTCGC CCTGGAAAGA CGAGATCGGC 
ATTGATGTGC TGATCAGCCC GGATGAGGAA ATCGGCTCGC TGGGCTCCGG CCCGGTCCTC 
GCCGAGCTGG GCGCCGGTGC CGATATCGGC ATGACCTATG AGCCGGCGCT GGCCGATGGT 
TCGCTGGCCG GAGCGCGCAA GGGCTCGGGC AACTGGTCCC TGAAAGTGTC GGGCCGGGCC 
GCCCATGCTG GCCGCGAACA TCATCTCGGT CGCAATGCGC TGGCGGCCGC CTGCCAGTTC 
GGCCTCGGGC TGGACGATCT CAATGGCAAG CGCCCGGACG TGACTTTCAA TCTGGCCCGT 
ATCGATGGCG GCGGACCGCC GAATGTCGTT CCCGACAACG CTGTTGTGCG GTTCAATGTG 
CGGGTCAAGA CCGAGAATGA CCGTGTCTGG GTCGAAGCAG AACTCGAGCG ACTGGTCGAT 
GAAATCTGTG TGCGTGACGG GATCGACGCC GAATTGCATG GTGGTTTCAC GCGCCCGCCC 
AAACCCATGT CGCCGGCCAA TGCCAAGATG TTCGAATGGA CGCGCGCAGC TGGGACCGCA 
CTGGGTCTGG ACATTCGCTG GCAGGATACG GGCGGCGTCT GTGAGGGCAA TAATCTGTGG 
GCCGCCGGCT GTCCGAATGT CGACACCCTT GGTGTCCGCG GCGCCGACAT CCACTCGGAT 
CGTGAGATCG TCAAACTGTC CAGTTTCGCC GAGCGCGCCA AACTCTCAGC CATTTTGCTG 
ATGAAGTTCG CGCAAGGCCA ATTTGACGCG CGGGAAGCGC GCGCGCTGGC AAAGGCCGGC 
ACTCAAGATT GA

Protein sequence

MQIKLDLNPE ERAVLDWIDT RADGMIKTAK AWSAINSGSR NADGLEAMRA ELETAFAATG 
GEISAIELPP TTVVDPDGTV REQAFTPAFH CRIRPQAPIR IVMTGHHDTV FPADSHFQAT 
ELWDDDTLNG PGVADMKGGI LVMLHGILGL ERSPWKDEIG IDVLISPDEE IGSLGSGPVL 
AELGAGADIG MTYEPALADG SLAGARKGSG NWSLKVSGRA AHAGREHHLG RNALAAACQF 
GLGLDDLNGK RPDVTFNLAR IDGGGPPNVV PDNAVVRFNV RVKTENDRVW VEAELERLVD 
EICVRDGIDA ELHGGFTRPP KPMSPANAKM FEWTRAAGTA LGLDIRWQDT GGVCEGNNLW 
AAGCPNVDTL GVRGADIHSD REIVKLSSFA ERAKLSAILL MKFAQGQFDA REARALAKAG 
TQD