Gene EcolC_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2000
Symbol
ID	6068133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2207534
End bp	2209756
Gene Length	2223 bp
Protein Length	740 aa
Translation table	11
GC content	55%
IMG OID	641601414
Product	electron transport complex protein RnfC
Protein accession	YP_001724973
Protein GI	170020019
COG category	[C] Energy production and conversion
COG ID	[COG4656] Predicted NADH:ubiquinone oxidoreductase, subunit RnfC
TIGRFAM ID	[TIGR01945] electron transport complex, RnfABCDGE type, C subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000227688
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.287278
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAGT TATTCTCTGC ATTCAGAAAA AATAAAATCT GGGATTTCAA CGGCGGCATC 
CATCCACCGG AGATGAAAAC CCAGTCCAAC GGTACACCCC TGCGCCAGGT ACCCCTGGCG 
CAGCGTTTTG TTATTCCACT GAAACAGCAT ATTGGCGCTG AAGGTGAGTT GTGCGTTAGC 
GTCGGCGATA AAGTATTGCG CGGCCAGCCG CTTACCCGTG GTCGCGGCAA AATGCTGCCT 
GTTCACGCGC CCACCTCGGG TACCGTTACG GCTATTGCGC CCCACTCTAC GGCTCATCCT 
TCAGCTTTAG CTGAATTAAG CGTGATTATT GATGCCGATG GTGAAGACTG CTGGATCCCG 
CGCGACGGCT GGGCCGATTA TCGCACTCGC AGTCGCGAAG AGTTAATCGA GCGCATACAT 
CAGTTTGGTG TTGCCGGGCT GGGCGGTGCA GGATTCCCGA CAGGCGTTAA ATTGCAGGGT 
GGCGGAGATA AGATTGAAAC GTTGATTATC AACGCGGCTG AGTGCGAGCC GTACATTACC 
GCCGATGACC GTTTGATGCA GGATTGCGCG GCTCAGGTCG TAGAGGGTAT TCGCATTCTT 
GCGCATATTC TGCAGCCACG CGAAATTCTT ATCGGCATTG AAGATAACAA ACCGCAGGCG 
ATTTCCATGC TGCGCGCGGT GCTGGCGGAC TCTAACGATA TTTCTCTGCG GGTGATTCCA 
ACCAAATATC CTTCTGGCGG TGCTAAACAA TTAACCTACA TTCTGACCGG GAAGCAGGTT 
CCACATGGCG GGCGTTCATC CGATATCGGC GTATTAATGC AAAACGTCGG CACTGCTTAT 
GCAGTGAAAC GTGCCGTTAT TGATGGCGAG CCGATTACCG AGCGTGTTGT AACCCTGACT 
GGCGAAGCAA TCGCTCGCCC GGGCAACGTC TGGGCACGGC TGGGGACGCC AGTGCGTCAT 
TTATTGAATG ATGCCGGATT CTGCCCCTCT GCCGATCAAA TGGTGATTAT GGGTGGCCCG 
CTAATGGGCT TTACCTTGCC ATGGCTGGAT GTCCCGGTCG TAAAGATTAC CAACTGTCTG 
TTGGCTCCCT CTGCCAATGA ACTTGGCGAA CCACAGGAAG AACAAAGCTG CATCCGGTGT 
AGCGCCTGTG CTGACGCCTG CCCTGCGGAT CTTTTGCCGC AACAGTTGTA CTGGTTCAGC 
AAAGGTCAGC AACACGATAA AGCTACCACG CATAACATTG CTGATTGCAT TGAATGTGGG 
GCTTGCGCGT GGGTTTGCCC GAGCAATATT CCCCTGGTGC AATATTTCCG TCAGGAAAAA 
GCTGAAATTG CGGCTATTCG TCAGGAAGAA AAGCGCGCCG CAGAAGCCAA AGCGCGTTTC 
GAAGCGCGCC AGGCTCGTCT GGAGCGCGAA AAAGCGGCTC GCCTTGAACG ACATAAGAGC 
GCAGCCGTTC AACCTGCAGC CAAAGATAAA GATGCGATTG CTGCCGCTCT GGCGCGGGTG 
AAAGAGAAAC AGGCCCAGGC TACACAGCCT ATTGTGATTA AAGCGGGCGA ACGCCCGGAT 
AACAGTGCAA TTATTGCAGC ACGGGAAGCC CGTAAAGCGC AAGCCAGAGC GAAACAGGCA 
GAACTGCAGC AAACTAACGA CGCAGCAACC GTTGCTGATC CACGTAAAAC TGCCGTTGAA 
GCAGCTATCG CCCGCGCCAA AGCGCGCAAG CTGGAACAGC AACAGGCTAA TGCGGAACCA 
GAAGAACAGG TCGATCCGCG CAAAGCCGCC GTCGAAGCCG CTATTGCCCG TGCCAAAGCA 
CGCAAGCTGG AACAGCAACA GGCTAATGCC GAGCCAGAAC AACAGGTCGA TCCGCGCAAA 
GCCGCCGTCG AAGCCGCTAT TGCCCGTGCC AAAGCACGCA AGCTGGAACA GCAACAGGCT 
AATGCCGAGC CAGAACAACA GGTCGATCCG CGCAAAGCCG CCGTCGAAGC CGCTATTGCC 
CGAGCCAAAG CGCGCAAACG GGAACAGCAA CCGGCTAATG CGGAGCCAGA AGAACAGGTT 
GATCCGCGCA AAGCTGCCGT CGAAGCGGCT ATTGCACGCG CCAAAGCACG CAAGCTGGAA 
CAGCAACAGG CTAATGCGGT ACCAGAAGAA CAGGTTGATC CGCGCAAAGC GGCAGTTGCC 
GCGGCTATTG CCCGCGCTCA GGCCAAAAAA GCCGCCCAGC AGAAGGTTGT AAACGAGGAC 
TAA

Protein sequence

MLKLFSAFRK NKIWDFNGGI HPPEMKTQSN GTPLRQVPLA QRFVIPLKQH IGAEGELCVS 
VGDKVLRGQP LTRGRGKMLP VHAPTSGTVT AIAPHSTAHP SALAELSVII DADGEDCWIP 
RDGWADYRTR SREELIERIH QFGVAGLGGA GFPTGVKLQG GGDKIETLII NAAECEPYIT 
ADDRLMQDCA AQVVEGIRIL AHILQPREIL IGIEDNKPQA ISMLRAVLAD SNDISLRVIP 
TKYPSGGAKQ LTYILTGKQV PHGGRSSDIG VLMQNVGTAY AVKRAVIDGE PITERVVTLT 
GEAIARPGNV WARLGTPVRH LLNDAGFCPS ADQMVIMGGP LMGFTLPWLD VPVVKITNCL 
LAPSANELGE PQEEQSCIRC SACADACPAD LLPQQLYWFS KGQQHDKATT HNIADCIECG 
ACAWVCPSNI PLVQYFRQEK AEIAAIRQEE KRAAEAKARF EARQARLERE KAARLERHKS 
AAVQPAAKDK DAIAAALARV KEKQAQATQP IVIKAGERPD NSAIIAAREA RKAQARAKQA 
ELQQTNDAAT VADPRKTAVE AAIARAKARK LEQQQANAEP EEQVDPRKAA VEAAIARAKA 
RKLEQQQANA EPEQQVDPRK AAVEAAIARA KARKLEQQQA NAEPEQQVDP RKAAVEAAIA 
RAKARKREQQ PANAEPEEQV DPRKAAVEAA IARAKARKLE QQQANAVPEE QVDPRKAAVA 
AAIARAQAKK AAQQKVVNED