Gene Mmar10_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1990
Symbol
ID	4286788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2171209
End bp	2172327
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	64%
IMG OID	638141491
Product	protein of unknown function DUF900, hydrolase family protein
Protein accession	YP_757220
Protein GI	114570540
COG category	[S] Function unknown
COG ID	[COG4782] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.972188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGAC TGTATCGCTT GATTGCCCTG GCGACTGTGC TGGCTGGCCT GTCGGCCTGC 
ACGCATGTCC CTGCCCGCCT GCCCATCCTC GACACGTCGG CTGCAGACGG ACGCAGCGAA 
ACGATCCTGA TCGCCACGAC CCGGGTGCCC AGCGAGGATC CCGCCCTGCG CCTCTCAAGC 
CTGCGTGGCG ACCTGTCCTT CGCGCGGGCG GATGTCTGGG TGCCATCAAA CCGGCACGCC 
GGTGAGATCA ATCATCCATC CCGCCAGCCG GACCCGTCAC GCGAATTCGG CCTGACCGGC 
TATCAGGAGG GTATGAGCTC CGCAGACTGG TATGATGATC TGGACCGCCA GCTATCGGCC 
CTGCCTCTGA CCGAACGGCA GGTGCTGGTA TTCGTGCACG GCTTCAACAC ACCATTTTCC 
GACGGGCTCT ATCTGAATGC CCAGATTCTC AATGACTTCG GCGTCAACAC GGTCGCGGTT 
CATTATGCCT GGCCGTCGGC AGGCCAGGTG ACGGCCTATC TCCAGGACCG GGACAGCGCC 
CTGTTTGCCC GGGACGGTCT GGCAGACTTG CTGGTGACTG TCGCAGATAG TCCATCGATC 
TCGGTCACGA TTCTCGCCCA CTCAATGGGG GCACATGTGA CGATGGAGGC GTTGCGACAG 
CTAAGTCTTG AGGGTCGCAG CGAGGTGCTG GCCAAGATCG ATCCGGTCAT TCTCGCCATG 
CCGGACATCG CTTTTGACGT GTTTTTCAGC CAACTCGATG CGATCGAGCC ACGCCCGGAG 
AACATGACCG TGCTGGTCTC CGGCCGCGAC CAGGCCCTTC GCGTCTCCGA CTCGCTCAGC 
GGCGGTGGTC TGGCCCGGAT CGGAATCGGC GCCCAGCAGG ACGCGCTGAC CGCGCACGGG 
ATAGCCGTTC TGGATCTGAC CGGGTTGCGC GACGGCACCG TGATCGGCCA CACCGATTTC 
GCAGCCTCGA CAACATTGAT GCAACTCGCG GCGAGCGGTG CGCTCGACCA TGCCTTCAAT 
GCCGAAGCTC AATCGTCGGG AAGCCTGCTG CCCGCCCCCC TGGCGGCCAT AGCGGCGCAG 
ATCATCCGCC TGCCGGCCCG GGCTTTCGGC GACAACTGA

Protein sequence

MIRLYRLIAL ATVLAGLSAC THVPARLPIL DTSAADGRSE TILIATTRVP SEDPALRLSS 
LRGDLSFARA DVWVPSNRHA GEINHPSRQP DPSREFGLTG YQEGMSSADW YDDLDRQLSA 
LPLTERQVLV FVHGFNTPFS DGLYLNAQIL NDFGVNTVAV HYAWPSAGQV TAYLQDRDSA 
LFARDGLADL LVTVADSPSI SVTILAHSMG AHVTMEALRQ LSLEGRSEVL AKIDPVILAM 
PDIAFDVFFS QLDAIEPRPE NMTVLVSGRD QALRVSDSLS GGGLARIGIG AQQDALTAHG 
IAVLDLTGLR DGTVIGHTDF AASTTLMQLA ASGALDHAFN AEAQSSGSLL PAPLAAIAAQ 
IIRLPARAFG DN