Gene EcolC_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1999
Symbol	rnfD
ID	6068135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2206475
End bp	2207533
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	53%
IMG OID	641601413
Product	electron transport complex protein RnfD
Protein accession	YP_001724972
Protein GI	170020018
COG category	[C] Energy production and conversion
COG ID	[COG4658] Predicted NADH:ubiquinone oxidoreductase, subunit RnfD
TIGRFAM ID	[TIGR01946] electron transport complex, RnfABCDGE type, D subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00297126
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.240124
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATTCA GAATAGCTAG CTCCCCTTAT ACCCATAACC AGCGCCAGAC ATCGCGCATT 
ATGCTGTTGG TGTTGCTCGC AGCCGTGCCA GGAATCGCAG CGCAACTGTG GTTTTTTGGT 
TGGGGTACTC TCGTTCAGAT CCTGTTGGCA TCGGTTAGTG CTCTGTTAGC CGAAGCTCTC 
GTACTCAAAC TACGCAAGCA GTCGGTAGCC GCAACGTTGA AAGATAACTC AGCATTGCTG 
ACAGGCTTAT TGCTGGCGGT AAGTATTCCC CCCCTCGCGC CATGGTGGAT GGTCGTGCTG 
GGTACGGTGT TTGCGGCGAT CATCGCTAAA CAGTTGTATG GCGGTCTGGG GCAAAACCCG 
TTTAATCCGG CAATGATTGG TTATGTGGTC TTACTGATCT CCTTCCCTGT GCAGATGACC 
AGCTGGTTAC CGCCACATGA AATTGCGGTC AACATCCCTG GTTTTATCGA CGCCATACAG 
GTTATTTTCA GCGGACATAC CGCCAGTGGT GGTGATATGA ACACACTACG CTTAGGTATT 
GATGGCATTA GTCAGGCGAC ACCGCTGGAT ACATTTAAAA CCTCTGTCCG TGCCGGTCAT 
TCGGTTGAAC AGATTATGCA ATATCCGATC TACAGCGGTA TTCTGGCGGG CGCTGGTTGG 
CAATGGGTAA ATCTCGCCTG GCTGGCTGGC GGCCTGTGGT TGCTATGGCA GAAAGCGATT 
CGCTGGCATA TTCCCCTCAG CTTCTTAGTA ACGCTGGCGT TATGCGCAAC GTTGGGCTGG 
TTGTTCTCAC CAGAAACACT GGCAGCACCG CAAATTCATC TGCTGTCTGG TGCGACCATG 
CTCGGCGCAT TCTTTATTTT GACTGACCCG GTTACCGCTT CTACGACCAA TCGTGGTCGT 
CTTATTTTCG GCGCGCTGGC GGGCTTATTA GTCTGGTTGA TCCGCAGTTT CGGCGGCTAT 
CCTGACGGCG TGGCTTTTGC CGTCCTGCTG GCGAACATCA CGGTTCCTCT GATCGATTAC 
TACACGCGTC CGCGCGTCTA CGGCCATCGC AAAGGGTAA

Protein sequence

MVFRIASSPY THNQRQTSRI MLLVLLAAVP GIAAQLWFFG WGTLVQILLA SVSALLAEAL 
VLKLRKQSVA ATLKDNSALL TGLLLAVSIP PLAPWWMVVL GTVFAAIIAK QLYGGLGQNP 
FNPAMIGYVV LLISFPVQMT SWLPPHEIAV NIPGFIDAIQ VIFSGHTASG GDMNTLRLGI 
DGISQATPLD TFKTSVRAGH SVEQIMQYPI YSGILAGAGW QWVNLAWLAG GLWLLWQKAI 
RWHIPLSFLV TLALCATLGW LFSPETLAAP QIHLLSGATM LGAFFILTDP VTASTTNRGR 
LIFGALAGLL VWLIRSFGGY PDGVAFAVLL ANITVPLIDY YTRPRVYGHR KG