Gene Mmar10_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1601
Symbol
ID	4283923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	1753227
End bp	1754894
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	65%
IMG OID	638141088
Product	urocanate hydratase
Protein accession	YP_756831
Protein GI	114570151
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.308587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGA CCCGCCGCGA CAATTCCCGC ATCATCCGCG CCAAGCATGG CTCAGAGCTC 
GACGCTACCC ATTGGGCCGC CGAGGCGCCC TTGCGCATGC TGATGAATAA TCTCGACCCC 
GACGTGGCGG AGAAGCCGGA AGAGCTGGTT GTCTATGGCG GGATCGGCCG GGCCGCGCGC 
GACTGGGAGA GCTATGACCG CATCGTCGCG ACGCTGAAAC GCCTGAAGGA AGACGAGACC 
CTGCTGGTCC AGTCCGGCAA GCCGGTCGGG GTCTTCCGCA CTCACAAGGA TGCCCCGCGC 
GTGCTGATCG CCAATTCCAA TCTCGTGCCC AACTGGGCCA ATTGGGATCA TTTCCGCGAG 
CTCGATAAGA AGGGCCTGAT GATGTACGGC CAGATGACGG CCGGCTCCTG GATCTATATC 
GGCTCGCAAG GCATCGTTCA GGGCACGTAT GAGACTTTCG TTGAGGCCGG TCGCCAGCAT 
TATGACGGTG ACCTCACCGG CAAGTGGATC CTGACCGGCG GGCTTGGCGG CATGGGCGGC 
GCCCAGCCGC TGGCTGCGAC GATGGCCGGC GCCTCCATGC TGGCGGTGGA ATGCCAGCCG 
AGCCGGATCG AGATGCGGCT GAAGACCGGC TATCTCGACA AGAGCGCCAC CACGCTGGAC 
GAGGCGCTGG AAATCATCAA CGCGGCCTGC GCCAAGGGCG AGGCGGTCTC GGTCGGCCTG 
CTGGGCAATG CGGCCGAGGT CTTCCCGGAA CTGGTGAAAC GCGGCGTCAA GCCGGACATG 
GTCACCGACC AGACCTCCGC CCATGACCCC GCAAACGGCT ATCTGCCCGC TGGCTGGACC 
CTCGCCGAAT GGGACGAAAA ACGCGAGAGC GATCCCGCCG CCGTCGAAGC GGCCGCAAAA 
GCCTCCATGG CGGAGCAGGT CAAAGCCATG CTGGCCTTTT GGGAGCAGGG CATCCCGACG 
CTCGATTATG GAAACAATAT CCGCCAGATG GCCTTTGACG AGGGCGTTAC CAACGCCTTC 
GATTTTCCCG GCTTCGTGCC GGCCTATATC CGCCCGCTGT TTTGCCGCGG CATTGGCCCT 
TTCCGCTGGG CGGCGCTGTC GGGTGATCCC GAAGACATCT ACAAGACCGA CGCCAAGGTG 
AAGGAACTGA TCCCGGACAA TCCGCACCTT CACCGCTGGC TCGACATGGC GCGCGAGCGC 
ATCCACTTCC AGGGCCTGCC GGCGCGGATC TGCTGGGTCG GCCTGGGCGA GCGCCACAAG 
CTGGGCCTCG CCTTCAACGA GATGGTCCGC ACGGGCGAGC TCTCCGCCCC CGTCGTAATC 
GGCCGCGACC ATCTCGACTC AGGCTCGGTC GCCAGCCCGA ACCGAGAAAC CGAAGCGATG 
ATGGACGGCT CAGACGCCGT CGCCGACTGG CCGCTCCTCA ACGCGCTCCT CAACACGGCT 
TCGGGCGCCA CCTGGGTCTC GTTGCATCAT GGTGGCGGCG TCGGCATGGG CTATTCCCTG 
CACTCCGGCC AGGTCGTCCT CGCCGACGGC ACGGTTGAGG CCGCAGAGCG CGTTGGTCGG 
GTGTTGTGGA ATGATCCGGG CACGGGCGTG ATGCGTCACG CCGATGCCGG CTATGAGATC 
GCGAAGGACT GCGCGAAGGA GCAGGGGCTG GATCTGCCGA GTGTGTAG

Protein sequence

MTQTRRDNSR IIRAKHGSEL DATHWAAEAP LRMLMNNLDP DVAEKPEELV VYGGIGRAAR 
DWESYDRIVA TLKRLKEDET LLVQSGKPVG VFRTHKDAPR VLIANSNLVP NWANWDHFRE 
LDKKGLMMYG QMTAGSWIYI GSQGIVQGTY ETFVEAGRQH YDGDLTGKWI LTGGLGGMGG 
AQPLAATMAG ASMLAVECQP SRIEMRLKTG YLDKSATTLD EALEIINAAC AKGEAVSVGL 
LGNAAEVFPE LVKRGVKPDM VTDQTSAHDP ANGYLPAGWT LAEWDEKRES DPAAVEAAAK 
ASMAEQVKAM LAFWEQGIPT LDYGNNIRQM AFDEGVTNAF DFPGFVPAYI RPLFCRGIGP 
FRWAALSGDP EDIYKTDAKV KELIPDNPHL HRWLDMARER IHFQGLPARI CWVGLGERHK 
LGLAFNEMVR TGELSAPVVI GRDHLDSGSV ASPNRETEAM MDGSDAVADW PLLNALLNTA 
SGATWVSLHH GGGVGMGYSL HSGQVVLADG TVEAAERVGR VLWNDPGTGV MRHADAGYEI 
AKDCAKEQGL DLPSV