Gene B21_02171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02171
Symbol	nuoC
ID	8113026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2288617
End bp	2290419
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	56%
IMG OID	644848377
Product	hypothetical protein
Protein accession	YP_002999950
Protein GI	251785646
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01961] NADH (or F420H2) dehydrogenase, subunit C [TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAACA ATATGACCGA CTTAACCGCG CAAGAACCCG CCTGGCAGAC CCGCGATCAT 
CTTGATGATC CGGTGATTGG CGAACTGCGC AACCGTTTTG GGCCGGATGC CTTTACTGTT 
CAGGCGACTC GCACCGGGGT TCCCGTTGTG TGGATCAAGC GTGAACAATT ACTGGAAGTT 
GGCGATTTCT TAAAGAAACT GCCGAAACCT TACGTCATGC TGTTTGACTT ACACGGCATG 
GACGAACGTC TGCGCACACA CCGCGAAGGG TTACCTGCCG CGGATTTTTC CGTTTTCTAC 
CATCTGATTT CTATCGATCG TAACCGCGAC ATCATGCTGA AGGTGGCGCT GGCAGAAAAC 
GACCTGCACG TACCGACCTT CACCAAACTG TTCCCGAACG CTAACTGGTA TGAGCGTGAA 
ACCTGGGATC TGTTTGGCAT TACTTTCGAC GGTCACCCGA ACCTGCGACG CATCATGATG 
CCGCAAACCT GGAAAGGTCA CCCGCTGCGT AAAGATTATC CGGCGCGCGC TACCGAATTC 
TCGCCGTTTG AGCTGACCAA AGCCAAACAG GATCTGGAGA TGGAAGCCCT GACCTTCAAA 
CCGGAAGAGT GGGGGATGAA GCGCGGCACC GAAAACGAGG ACTTCATGTT CCTCAACCTC 
GGTCCGAACC ACCCGTCGGC GCACGGGGCT TTCCGTATCG TTTTGCAACT CGATGGCGAA 
GAGATTGTCG ACTGCGTACC AGACATCGGT TACCACCACC GTGGTGCGGA GAAAATGGGC 
GAACGCCAGT CCTGGCACAG CTACATTCCG TATACTGACC GTATCGAATA CCTCGGCGGC 
TGCGTTAACG AAATGCCTTA CGTGCTGGCG GTAGAGAAAC TGGCCGGGAT CACCGTGCCG 
GATCGCGTTA ACGTCATTCG CGTTATGCTC TCCGAACTGT TCCGCATCAA CAGTCACCTG 
CTGTATATCT CGACCTTTAT TCAGGACGTC GGCGCAATGA CGCCAGTGTT CTTCGCCTTT 
ACCGATCGTC AGAAAATTTA CGATCTGGTG GAAGCGATCA CGGGTTTCCG TATGCACCCG 
GCGTGGTTCC GTATTGGCGG CGTAGCGCAC GACCTGCCGC GCGGCTGGGA TCGCCTGCTG 
CGTGAGTTCC TCGACTGGAT GCCGAAACGT CTGGCGTCTT ACGAGAAAGC GGCGCTGCAA 
AACACCATTC TGAAAGGTCG TTCCCAGGGC GTTGCCGCCT ATGGCGCGAA AGAGGCGCTG 
GAGTGGGGCA CCACTGGCGC GGGCCTGCGT GCTACCGGGA TCGACTTCGA CGTGCGTAAG 
GCGCGTCCTT ATTCTGGCTA TGAAAACTTC GACTTTGAAA TCCCGGTGGG TGGTGGCGTT 
TCTGACTGCT ACACCCGCGT AATGCTTAAA GTGGAAGAGC TGCGCCAGAG TCTGCGCATT 
CTTGAGCAGT GCCTCAACAA CATGCCGGAA GGCCCGTTCA AAGCGGATCA CCCGCTGACC 
ACGCCGCCGC CGAAAGAGCG CACGCTGCAA CATATCGAAA CCCTGATCAC CCACTTCCTG 
CAAGTGTCGT GGGGGCCGGT GATGCCTGCC AATGAATCTT TCCAGATGAT TGAGGCGACC 
AAGGGGATCA ACAGTTACTA CCTGACCAGC GACGGTAGCA CCATGAGTTA TCGCACTCGT 
ATCCGCACGC CGAGTTATGC GCATTTGCAG CAAATTCCGG CGGCGATCCG CGGCAGCCTG 
GTGTCTGACC TGATTGTTTA TCTGGGCAGT ATCGATTTTG TTATGTCAGA TGTGGACCGC 
TAA

Protein sequence

MVNNMTDLTA QEPAWQTRDH LDDPVIGELR NRFGPDAFTV QATRTGVPVV WIKREQLLEV 
GDFLKKLPKP YVMLFDLHGM DERLRTHREG LPAADFSVFY HLISIDRNRD IMLKVALAEN 
DLHVPTFTKL FPNANWYERE TWDLFGITFD GHPNLRRIMM PQTWKGHPLR KDYPARATEF 
SPFELTKAKQ DLEMEALTFK PEEWGMKRGT ENEDFMFLNL GPNHPSAHGA FRIVLQLDGE 
EIVDCVPDIG YHHRGAEKMG ERQSWHSYIP YTDRIEYLGG CVNEMPYVLA VEKLAGITVP 
DRVNVIRVML SELFRINSHL LYISTFIQDV GAMTPVFFAF TDRQKIYDLV EAITGFRMHP 
AWFRIGGVAH DLPRGWDRLL REFLDWMPKR LASYEKAALQ NTILKGRSQG VAAYGAKEAL 
EWGTTGAGLR ATGIDFDVRK ARPYSGYENF DFEIPVGGGV SDCYTRVMLK VEELRQSLRI 
LEQCLNNMPE GPFKADHPLT TPPPKERTLQ HIETLITHFL QVSWGPVMPA NESFQMIEAT 
KGINSYYLTS DGSTMSYRTR IRTPSYAHLQ QIPAAIRGSL VSDLIVYLGS IDFVMSDVDR