Gene Rleg_5947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5947
Symbol
ID	8016367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	-
Start bp	491383
End bp	493047
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	57%
IMG OID	644828060
Product	cytochrome c oxidase, subunit I
Protein accession	YP_002979260
Protein GI	241518632
COG category	[C] Energy production and conversion
COG ID	[COG0843] Heme/copper-type cytochrome/quinol oxidases, subunit 1
TIGRFAM ID	[TIGR02891] cytochrome c oxidase, subunit I

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACGCA ATGATGCAAC GCACTTAAAC ACCAATCTCC ATCGAGAGGG GCTTTCCCAG 
ACTCGGGAGG AACGCGTCAG CTATTTGAGG GCAGGCCACA GTCTGCGCTC ATGGCTTCTA 
TCGACGGACC ATAAGCGTGT CGCGATTCTT TATCTCATCG CAATTACATT CTTCTTCTTC 
ATCGGCGGCG TCGCCGCTGC TCTTGTGCGC GCGGATCTCC TGACACCGCA GGGAGATTTG 
CTGACCAATG AGGGCTACAA TCGTGCCTTC ACCCTCCACG GCGTGATCAT GGTCTGGTTC 
TTCCTCATTC CGTCTATTCC GAACACGTTT GGCAATTTCC TGATCCCGCT GATGATCGGC 
GCGCGCGACC TTGCGTTCCC GCGCCTCAAT CTCCTGAGCT GGTATATCTT TGTATTGGCT 
GGCTTGTTCA CATTGATTGT GGTGGTCACC GGCGGCGTCG ATACCGGATG GACATTCTAC 
ACGCCGCTCT CCTCCATGTT TTCGAACGGA AACGTTGTTC TTGCAGCGAC GGCGGTTTTC 
ATCGCCGGGT TCTCGTCCAT TCTAACCGGG CTGAACTTCA TCGTCACGAT CCACAAGCTT 
CGATGCCCGG GTATGACCTG GGGTCGTCTG CCGCTCTTTG TCTGGTCGCA TTACGCGACA 
TCGCTCGTTC TTGTCCTGGC GACGCCTGTT TTGTCGGTCA CGCTGGTGCT GATCGTCGCT 
GAACGCTTTT TCCACCTCGG CGTCTTCGAT CCTGCTCTGG GTGGCGATCC TCTGCTTTAC 
CAGCACCTGT TCTGGTTCTA CAGCCATCCT GCGGTCTATA TCATGGTGCT CCCGGCACTC 
GGGGTGGTCA GCGAGCTGAT AGCTGCTGCC GCCCGCAAAC CCGTGTTTGG TTATCAGTTC 
GTGGCTGGGT CCTCCATGGC GATCGCCGCA ATTGGCTTCC TTGTCTGGGG GCATCACATG 
TTCGTTTCCG GCCAGTCGAT GTACGCCAGC GCCGCGTTCT CATTACTGAG CTTGGCCGTC 
GCGGTTCCGT CAGGCATCAA GGTCTATAAT TGGACCGCAA CCCTCTATAA GGGCCACATT 
GGCCTCGATC CGCCGTTTCT CTTTGCCATG GGCTTCATCG GTCTGTTCGT TGTCGGCGGA 
TTGACTGGGC TCATGCTCGC CATGCTGGCT ATCGACCTCC ACGTCCACGA CACCTATTTC 
GTGGTGGCGC ATTTTCACTA CATTATGGTT GGCGGTACCG TATCCGCCTT CTTCGGCGCC 
CTGCACTATT GGTGGCCGAA GATCATCGGC CGCCGCTACA ACCACATCTG GGGCAGTATT 
ACTGCCATTT TCATTTTTCT TGGATTCAAC ATGACTTTTT TCCCGCAGTT CCTGTTGGGT 
TACTGGGGCA TGCCACGGCG CTACCATGTG TACCCGCCCG AGTTCCAGAC CCTGCACGTA 
CTGTCGTCTG CCGGAGCGAC CATTCTTGGG TTCGCCTATC TAACGCCCTT CGTCTACCTG 
TTCTATTCCA TGCGTTATGG CCAACCTGCG GGTGATAACC CTTGGGATGC ACGTGGACTG 
GAGTGGACGG TGCCATCGCC GCCGCCGAAG CACAACTTCG ACCATCTGCC GGTCGTTAGC 
GGCCCCCCTT ACGATTATCC GGTGGAGCGG GAGGGCGAAC AATGA

Protein sequence

MPRNDATHLN TNLHREGLSQ TREERVSYLR AGHSLRSWLL STDHKRVAIL YLIAITFFFF 
IGGVAAALVR ADLLTPQGDL LTNEGYNRAF TLHGVIMVWF FLIPSIPNTF GNFLIPLMIG 
ARDLAFPRLN LLSWYIFVLA GLFTLIVVVT GGVDTGWTFY TPLSSMFSNG NVVLAATAVF 
IAGFSSILTG LNFIVTIHKL RCPGMTWGRL PLFVWSHYAT SLVLVLATPV LSVTLVLIVA 
ERFFHLGVFD PALGGDPLLY QHLFWFYSHP AVYIMVLPAL GVVSELIAAA ARKPVFGYQF 
VAGSSMAIAA IGFLVWGHHM FVSGQSMYAS AAFSLLSLAV AVPSGIKVYN WTATLYKGHI 
GLDPPFLFAM GFIGLFVVGG LTGLMLAMLA IDLHVHDTYF VVAHFHYIMV GGTVSAFFGA 
LHYWWPKIIG RRYNHIWGSI TAIFIFLGFN MTFFPQFLLG YWGMPRRYHV YPPEFQTLHV 
LSSAGATILG FAYLTPFVYL FYSMRYGQPA GDNPWDARGL EWTVPSPPPK HNFDHLPVVS 
GPPYDYPVER EGEQ