Gene EcolC_1370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1370
Symbol
ID	6068123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1503482
End bp	1504459
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	54%
IMG OID	641600792
Product	NADH dehydrogenase subunit H
Protein accession	YP_001724363
Protein GI	170019409
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.638509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.284732
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTGGA TATCACCGGA ACTGATTGAG ATCCTGCTGA CCATCCTCAA AGCGGTGGTG 
ATCCTGCTGG TGGTTGTCAC CTGCGGGGCA TTCATGAGCT TTGGCGAACG TCGCCTGCTG 
GGTCTGTTCC AGAACCGTTA CGGACCTAAC CGTGTTGGCT GGGGCGGTTC GCTCCAGCTG 
GTTGCGGACA TGATCAAAAT GTTCTTTAAA GAAGACTGGA TCCCGAAATT CTCGGATCGC 
GTCATCTTTA CCCTGGCACC GATGATTGCC TTTACCTCGC TGCTGCTGGC CTTTGCGATT 
GTGCCAGTCA GTCCGGGTTG GGTGGTTGCC GACCTGAACA TCGGGATTTT GTTCTTCCTG 
ATGATGGCAG GTCTGGCGGT TTACGCGGTG CTGTTTGCGG GCTGGTCAAG TAACAACAAA 
TACTCGTTGC TGGGTGCGAT GCGTGCTTCT GCGCAGACCC TGAGCTACGA AGTGTTCCTC 
GGGCTTTCCT TGATGGGCGT GGTGGCGCAG GCCGGTTCAT TCAACATGAC CGACATCGTC 
AACAGCCAGG CGCATGTGTG GAACGTTATC CCGCAATTCT TTGGTTTTAT TACCTTTGCC 
ATCGCGGGCG TGGCGGTATG TCACCGTCAC CCGTTTGACC AGCCGGAAGC CGAGCAGGAA 
CTGGCGGATG GTTACCACAT TGAATATTCC GGTATGAAGT TCGGTCTGTT CTTCGTGGGT 
GAGTACATCG GGATTGTGAC CATCTCTGCA TTGATGGTGA CGCTGTTCTT CGGTGGCTGG 
CAAGGCCCGT TGTTACCGCC ATTCATCTGG TTCGCGCTGA AAACCGCGTT CTTTATGATG 
ATGTTCATTT TGATTCGTGC GTCGTTACCG CGTCCGCGTT ATGACCAGGT AATGTCCTTC 
GGCTGGAAAA TCTGCCTGCC GCTGACGCTG ATCAACTTGC TGGTAACGGC GGCTGTCATT 
CTCTGGCAGG CGCAATAA

Protein sequence

MSWISPELIE ILLTILKAVV ILLVVVTCGA FMSFGERRLL GLFQNRYGPN RVGWGGSLQL 
VADMIKMFFK EDWIPKFSDR VIFTLAPMIA FTSLLLAFAI VPVSPGWVVA DLNIGILFFL 
MMAGLAVYAV LFAGWSSNNK YSLLGAMRAS AQTLSYEVFL GLSLMGVVAQ AGSFNMTDIV 
NSQAHVWNVI PQFFGFITFA IAGVAVCHRH PFDQPEAEQE LADGYHIEYS GMKFGLFFVG 
EYIGIVTISA LMVTLFFGGW QGPLLPPFIW FALKTAFFMM MFILIRASLP RPRYDQVMSF 
GWKICLPLTL INLLVTAAVI LWQAQ