Gene Caul_4997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4997
Symbol
ID	5902459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5399037
End bp	5400416
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	68%
IMG OID	641565518
Product	mercuric reductase
Protein accession	YP_001686615
Protein GI	167648952
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGAA GTTTCGACGC CATCATCATC GGGGCCGGCC AGGCGGGTCC TTCGCTGGCC 
GGCCGCCTGA CCGCCGCGGG CCAGACCGTC GCGATCATCG AGCGCAAGGA TTTCGGCGGA 
ACCTGCGTCA ACACCGGCTG CATGCCGACC AAGACCCTGG TAGCCAGCGC CTACGCCGCC 
CATCTGGCCC GGCGCGCGGC CGACTACGGC GTGACCCTTG GCGGCCCCGT CGGCGTCGAT 
ATGAAACGGG TCCACGACCG GGCCAGGACC GTCACCCTCA ACGCCCGGGG CAATCTCGAG 
ACGTGGGTGA GCGGCATGAC GGGCTGCACG GTCTTTCGAG GCCATGCCCG CTTCGAGTCG 
GCCAACACCG TGCGGGTCGG CGACGAGGTG CTGACCGCGC CGAGGATCTT CCTCAATGTC 
GGCGGCCGGG CCAACGCGCC GCCCATGCCC GGGCTGGATG AGATCTCGTA CCTGACCAAT 
GTCGGGATGA TGGAGGTCGA CGACCTGCCC CGGCATCTGG TGGTGGTCGG CGGCAGCTAT 
ATCGGCCTGG AATTCGCCCA GATGTACCGG CGGTTCGGCG CCGAGGTGAC GGTGGTCGAG 
ATGGGTCCGC GCCTGATTGG GCGCGAGGAT CCGGAGATCT CGGACGCCGT CCGCGAGATC 
CTCGAGGCCG AGGGGGTGAA CATCCGCCTC AACGCCGAGT GCATCAGCTT CGCGCCCTGC 
GACGAAGGCG TCTGCGTGCA TGTCACCTGC GAGGACGGCG CGCCGCAGGT GACCGGATCG 
CACGTGCTGC TGGCCATCGG CCGCAAGCCT AACACCGACG ATCTGGGTTT GGACAAGGCC 
GGGATCGAGC TCGACAAGCG CGGCTATGTG GTGGTCGACG ACCAGCTGAA GACCAGCAAT 
CCCGGCGTCT GGGCCATGGG CGACTGCAAC GGCAAGGGCG CCTTCACCCA CACCGCCTAC 
AACGACTTCG AGATCATCGC CGCCAACCTG CTGGACAACG ACCCCAGGAA AGTCAGCGAC 
CGCATCACCT GCTACGGCCT GTTCATCGAC CCGCCGCTGG GCCGCGTCGG CATGACCGAG 
GCCGAGGCCC GCGCCACCGG CCGGCCGCTG CTGGTCGGCA AGCGCCCGAT GACCCGGGTC 
GGGCGGGCGG TCGAGAAGGG CGAGACGCAA GGCTTCATGA AGGTGCTGGT CGACGCCGAG 
AGCAAACAGA TCCTCGGCGC GGCGATCCTC GGCCTGAACG GCGACGAGGC GATCCACGGC 
ATGATCGACC TGATGTACGC CAAGGCGCCC TACACCACGA TCCAGCGCGC GGTGCACATC 
CACCCGACGG TGTCGGAACT GATCCCGACG ATGCTGGGCG AGCTGAAGCC GCTGGAATAG

Protein sequence

MARSFDAIII GAGQAGPSLA GRLTAAGQTV AIIERKDFGG TCVNTGCMPT KTLVASAYAA 
HLARRAADYG VTLGGPVGVD MKRVHDRART VTLNARGNLE TWVSGMTGCT VFRGHARFES 
ANTVRVGDEV LTAPRIFLNV GGRANAPPMP GLDEISYLTN VGMMEVDDLP RHLVVVGGSY 
IGLEFAQMYR RFGAEVTVVE MGPRLIGRED PEISDAVREI LEAEGVNIRL NAECISFAPC 
DEGVCVHVTC EDGAPQVTGS HVLLAIGRKP NTDDLGLDKA GIELDKRGYV VVDDQLKTSN 
PGVWAMGDCN GKGAFTHTAY NDFEIIAANL LDNDPRKVSD RITCYGLFID PPLGRVGMTE 
AEARATGRPL LVGKRPMTRV GRAVEKGETQ GFMKVLVDAE SKQILGAAIL GLNGDEAIHG 
MIDLMYAKAP YTTIQRAVHI HPTVSELIPT MLGELKPLE