Gene B21_02167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_02167
Symbol	nuoH
ID	8114245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	2283024
End bp	2284004
Gene Length	981 bp
Protein Length	327 aa
Translation table	11
GC content	54%
IMG OID	644848373
Product	hypothetical protein
Protein accession	YP_002999946
Protein GI	251785642
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTGGA TATCACCGGA ACTGATTGAG ATCCTGCTGA CCATCCTCAA AGCGGTGGTG 
ATCCTGCTGG TGGTTGTCAC CTGCGGGGCA TTCATGAGCT TTGGCGAACG TCGCCTGCTG 
GGTCTGTTCC AGAACCGTTA CGGACCTAAC CGTGTTGGCT GGGGCGGTTC GCTCCAGCTG 
GTTGCGGACA TGATCAAAAT GTTCTTTAAA GAAGACTGGA TCCCGAAATT CTCGGATCGC 
GTCATCTTTA CCCTGGCACC GATGATTGCC TTTACCTCGC TGCTGCTGGC CTTTGCGATT 
GTGCCAGTCA GTCCGGGTTG GGTGGTTGCC GACCTGAACA TCGGGATTTT GTTCTTCCTG 
ATGATGGCAG GTCTGGCGGT TTACGCGGTG CTGTTTGCGG GCTGGTCAAG TAACAACAAA 
TACTCGTTGC TGGGTGCGAT GCGTGCTTCT GCGCAGACCC TGAGCTACGA AGTGTTCCTC 
GGGCTTTCCT TGATGGGCGT GGTGGCGCAG GCCGGTTCAT TCAACATGAC CGACATCGTC 
AACAGCCAGG CGCATGTGTG GAACGTTATC CCGCAATTCT TTGGTTTTAT TACCTTTGCC 
ATCGCGGGCG TGGCGGTATG TCACCGTCAC CCGTTTGACC AGCCGGAAGC CGAGCAGGAA 
CTGGCGGATG GTTACCACAT TGAATATTCC GGTATGAAGT TCGGTCTGTT CTTCGTGGGT 
GAGTACATCG GGATTGTGAC CATCTCTGCA TTGATGGTGA CGCTGTTCTT CGGTGGCTGG 
CAAGGCCCGT TGTTACCGCC ATTCATCTGG TTCGCGCTGA AAACCGCGTT CTTTATGATG 
ATGTTCATTT TGATTCGTGC GTCGTTACCG CGTCCGCGTT ATGACCAGGT AATGTCCTTC 
GGCTGGAAAA TACTGCCTGC CGCTGACGCT GATCAACTTG CTGGTAACGG CGGCTGTCAT 
TCTCTGGCAG GCGCAATAAG G

Protein sequence

MSWISPELIE ILLTILKAVV ILLVVVTCGA FMSFGERRLL GLFQNRYGPN RVGWGGSLQL 
VADMIKMFFK EDWIPKFSDR VIFTLAPMIA FTSLLLAFAI VPVSPGWVVA DLNIGILFFL 
MMAGLAVYAV LFAGWSSNNK YSLLGAMRAS AQTLSYEVFL GLSLMGVVAQ AGSFNMTDIV 
NSQAHVWNVI PQFFGFITFA IAGVAVCHRH PFDQPEAEQE LADGYHIEYS GMKFGLFFVG 
EYIGIVTISA LMVTLFFGGW QGPLLPPFIW FALKTAFFMM MFILIRASLP RPRYDQVMSF 
GWKILPAADA DQLAGNGGCH SLAGAIR