Gene Rmet_1220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmet_1220
Symbol
ID	4038023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cupriavidus metallidurans CH34
Kingdom	Bacteria
Replicon accession	NC_007973
Strand	-
Start bp	1337867
End bp	1339114
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	64%
IMG OID	637976607
Product	benzoyl-CoA oxygenase subunit A
Protein accession	YP_583375
Protein GI	94310165
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0369] Sulfite reductase, alpha subunit (flavoprotein)
TIGRFAM ID	[TIGR03224] benzoyl-CoA oxygenase/reductase, BoxA protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.655891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0139439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCCG CCGACATCAT CAAGCAACAT CTGATCGACC CGGAAATCTG CATTCGCTGC 
AACACCTGCG AAGACACGTG CCCGATAGAT GCCATCACTC ACGACGACCG CAACTACGTG 
GTCAAGGCTG ACGTCTGCAA TGCGTGCAAT GCATGCCTGT CGCCCTGCCC CACCGGCGCC 
ATCGACAACT GGCGCACGAT GCTCAAGGGC CAGGCCTACA CCATCGAAGC CCAGTTGACC 
TGGGACGAAC TGCCGGAAGA GGTGCCGTTG CCGGAAGCGG AGATCGAGGC AGCGGCTGCG 
GCCGGGCAGG TCATCGAGGA AGCGTCGCGC GGCAGCAAAT CCGTGGCCGT TCAGGAGGTG 
GAGGCCAGTC GGCATACGTC ATCCAGGGCG CCGTGGTCGG CCGCGCATCC GTACGTCAAC 
CTGCATGGCG TGCGCGAGCC GGTGACCGCC ACAGTGGCCG GCAACCACCG GCTGACCGCC 
GAGGATGCAT CGAGCGACAT CCATCACATC GTGCTCGACT TCGGCAATCA CTTCTTTCCG 
GTGCTGGAAG GTCAGGCAAT CGGGATCGTC CCGCCCGGCA CCGATGCATC CGGAAAGCCG 
CACTACATCC GCATGTATTC GGTGGCCAGC CCGCGCGACG GCGAGCGGCC GGGTTATAAC 
AACCTCGCGC TGACCGTAAA GCGCGTGGAC ACCGATCACG ATGGCAACCC AGTGCGCGGC 
GTGGCGTCGA ACTTCCTGTG CGACCTGGCC AAGGGTGACC CTGTGCAGGT GGTCGGGCCG 
TTCGGCAGCA CATTCCTGAT GCCGAACCAC CGCGAAGCGA GCGTGATGAT GATCTGCACC 
GGTACCGGAT CCGCGCCGAT GCGGGCGATG ACCGAGCGTA TGCGCCGCAA CATGGACCAC 
TTCAGCGGTC GCCGGCTGCT GTTCTTCGGC GCCCGCAATC GGCGGGAACT GCCCTACTTT 
GGCCCGCTGC TGAAGCTACC CAAGGACTTC CTGGACATCC ACTTCGCGTT CTCGCGCGAT 
CCGGAGGTAC CGCGCCGGTA TGTGCAGGAC GCCATTCGCG AGGCCTCGGC CCAGGTGGCC 
GCGTTGCTGG CGGACCCGCA TGGTCATATC TACATCTGCG GACTCAAGGG GATGGAGGAA 
GGCGTGCTGG ATGCATTCGC CGAGGTCTGC GCCACGTCGG GTCAGTCGTG GCAGGACATC 
GAACCGCGCC TGCGTGCCGA AGGTCGCCTG CATATCGAAA CGTATTAG

Protein sequence

MGAADIIKQH LIDPEICIRC NTCEDTCPID AITHDDRNYV VKADVCNACN ACLSPCPTGA 
IDNWRTMLKG QAYTIEAQLT WDELPEEVPL PEAEIEAAAA AGQVIEEASR GSKSVAVQEV 
EASRHTSSRA PWSAAHPYVN LHGVREPVTA TVAGNHRLTA EDASSDIHHI VLDFGNHFFP 
VLEGQAIGIV PPGTDASGKP HYIRMYSVAS PRDGERPGYN NLALTVKRVD TDHDGNPVRG 
VASNFLCDLA KGDPVQVVGP FGSTFLMPNH REASVMMICT GTGSAPMRAM TERMRRNMDH 
FSGRRLLFFG ARNRRELPYF GPLLKLPKDF LDIHFAFSRD PEVPRRYVQD AIREASAQVA 
ALLADPHGHI YICGLKGMEE GVLDAFAEVC ATSGQSWQDI EPRLRAEGRL HIETY