Gene Rleg_0643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0643
Symbol
ID	8011822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	679297
End bp	681000
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	61%
IMG OID	644823233
Product	cytochrome c oxidase, subunit I
Protein accession	YP_002974486
Protein GI	241203390
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.365928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGAC CTTCCGCTCA CGACGATCAT TCTCATGATC ACGCCGCCCA TCATGACCAC 
GCGCATGACG ATCACCATGA TCACGGGCAC AAGCCGAGCT TTGCCAATCG CTGGCTGTTC 
TCGACCAACC ACAAGGACAT CGGCACGCTC TACCTGATCT TCGCGATCAT TGCCGGCATC 
ATCGGCGGCG CGCTGTCGGT TGCCATGCGC ATGGAGCTGC AGGAGCCTGG CATCCAGATC 
TTCCACGGCC TGGCCTCGAT GGTCTACGGC TATGAGGGTG ACGCTGCGAT CGACGGCGCC 
AAGCAGATGT TCAACATGTT CACGACCGCG CACGCGCTGA TCATGATCTT CTTCATGGTC 
ATGCCGGCGA TGATCGGCGG TTTCGCCAAC TGGATGGTGC CGATCATGAT CGGCGCGCCC 
GACATGGCTT TCCCGCGCCT CAACAACATC TCCTTCTGGC TGATCGTTCC CGCCTTCGCG 
CTGCTGCTGC TGTCGATGTT CGTCGAAGGC CCGGCAGGCG CTTATGGTAC GGGCGGTGGT 
TGGACGATGT ATCCGCCGCT GGCGACAACC GGCACGCCGG GACCGGCGGT CGACCTTGCG 
ATCTTCGCGC TCCACATTGC CGGCGCCTCG TCGATCCTCG GTGCGATCAA CTTCATCACC 
ACGATCCTCA ACATGCGCGC TCCCGGCATG ACGCTGCACA AGATGCCGCT GTTTGCCTGG 
TCCGTGCTGA TCACCGCCTT CCTGCTCTTG CTGTCGCTGC CGGTTCTGGC AGGCGGCATC 
ACCATGCTGC TCACCGACCG TAACTTCGGC ACATCCTTCT TCTCGCCGGA AGGCGGCGGC 
GACCCGATTC TTTACCAGCA CCTGTTCTGG TTCTTCGGTC ACCCCGAGGT CTACATCCTC 
ATCCTGCCGG GCTTCGGCAT GGTCAGCCAC ATCATCTCGA CCTTCTCGAA GAAGCCGATC 
TTCGGCTATC TCGGCATGGC CTACGCCATG GTCGCGATCG GCGCCGTCGG CTTCGTCGTC 
TGGGCTCACC ACATGTACAC GGTCGGCCTG TCGCTCGACG CACAGCGCTA CTTCGTCTTC 
GCGACGATGG TCATCGCCGT TCCGACGGGT GTGAAGATCT TCTCCTGGAT CGCGACGATG 
TGGGGCGGCT CGATCTCGTT CCGCACGCCG ATGCTCTGGG CGATCGGCTT CATCTTCCTG 
TTCACGGTCG GCGGCGTCAC CGGCGTCCAG CTCGCCAATG CCGGTCTCGA CCGCTCGCTG 
CATGACACCT ATTACGTCGT GGCCCACTTC CACTACGTTC TGTCGCTCGG CGCCGTCTTT 
GCGATCTTCG CCGGCTGGTA CTACTGGTTC CCGAAGATGA CCGGCTACAT GTACAACGAG 
CTGGTCGGCA AGCTGCATTT CTGGATCATG TTCATTGGCG TCAACCTGGT GTTCTTCCCG 
CAGCACTTCC TCGGTCTCGC CGGCATGCCG CGCCGCTACA TCGATTATCC GGATGCCTTT 
GCCGGCTGGA ACTACGTTTC CTCGATCGGC TCCTACATCT CGGCCTTCGG TGTGCTGATC 
TTCCTCTACG GCGTCTTCGA AGCCTTCGCC AAGAAGCGTG TGGCCGGCGA CAATCCGTGG 
GGTGAGGGTG CAACGACGCT CGAATGGCAG CTGCCTTCGC CGCCGCCCTA TCACCAGTGG 
GAACAGCTTC CGCGCATCAA GTAA

Protein sequence

MAGPSAHDDH SHDHAAHHDH AHDDHHDHGH KPSFANRWLF STNHKDIGTL YLIFAIIAGI 
IGGALSVAMR MELQEPGIQI FHGLASMVYG YEGDAAIDGA KQMFNMFTTA HALIMIFFMV 
MPAMIGGFAN WMVPIMIGAP DMAFPRLNNI SFWLIVPAFA LLLLSMFVEG PAGAYGTGGG 
WTMYPPLATT GTPGPAVDLA IFALHIAGAS SILGAINFIT TILNMRAPGM TLHKMPLFAW 
SVLITAFLLL LSLPVLAGGI TMLLTDRNFG TSFFSPEGGG DPILYQHLFW FFGHPEVYIL 
ILPGFGMVSH IISTFSKKPI FGYLGMAYAM VAIGAVGFVV WAHHMYTVGL SLDAQRYFVF 
ATMVIAVPTG VKIFSWIATM WGGSISFRTP MLWAIGFIFL FTVGGVTGVQ LANAGLDRSL 
HDTYYVVAHF HYVLSLGAVF AIFAGWYYWF PKMTGYMYNE LVGKLHFWIM FIGVNLVFFP 
QHFLGLAGMP RRYIDYPDAF AGWNYVSSIG SYISAFGVLI FLYGVFEAFA KKRVAGDNPW 
GEGATTLEWQ LPSPPPYHQW EQLPRIK