Gene EcolC_1189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1189
Symbol
ID	6066315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1302588
End bp	1304255
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	54%
IMG OID	641600605
Product	NADH dehydrogenase (ubiquinone) 30 kDa subunit
Protein accession	YP_001724183
Protein GI	170019229
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit [COG3262] Ni,Fe-hydrogenase III component G
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.454918
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGTTA ATTCATCGTC AAATCGTGGC GAAGCGATTC TCGCCGCCCT GAAAACGCAG 
TTCCCCGGCG CGGTGCTGGA TGAAGAGCGA CAAACGCCTG AACAGGTCAC CATTACGGTG 
AAAATCAATC TGCTGCCTGA CGTTGTACAG TATCTTTATT ATCAACATGA TGGCTGGCTT 
CCGGTCCTGT TTGGCAACGA CGAGCGGACA CTTAACGGTC ATTACGCGGT TTATTATGCC 
CTTTCAATGG AAGGGGCCGA AAAATGCTGG ATTGTGGTGA AGGCGCTGGT CGATGCCGAC 
AGTCGGGAGT TTCCGTCAGT CACACCGCGC GTCCCTGCCG CGGTCTGGGG CGAGCGAGAA 
ATTCGCGATA TGTACGGGCT GATTCCGGTT GGCCTGCCGG ATCAGCGTCG CCTGGTGTTG 
CCCGATGACT GGCCGGAAGA TATGCATCCG CTGCGCAAAG ATGCGATGGA TTATCGACTG 
CGCCCTGAAC CGACGACTGA TTCCGAAACG TATCCGTTTA TCAATGAGGG CAACAGCGAT 
GCGCGGGTGA TCCCTGTCGG CCCGCTGCAT ATCACCTCCG ATGAACCGGG TCACTTCCGC 
TTGTTTGTGG ATGGCGAGCA AATTGTCGAT GCTGATTACC GCCTGTTTTA TGTCCATCGC 
GGCATGGAGA AACTGGCAGA AACGCGGATG GGCTACAACG AAGTGACCTT CTTATCGGAC 
CGCGTGTGTG GGATTTGCGG TTTTGCCCAC AGTGTGGCCT ATACCAATTC GGTTGAAAAT 
GCACTGGGGA TTGAGGTGCC GCAACGAGCA CATACTATTC GCTCGATTCT GCTGGAAGTC 
GAACGGCTAC ACAGTCATTT GCTTAACCTT GGCCTCTCCT GCCATTTCGT TGGTTTTGAT 
ACCGGCTTTA TGCAATTTTT CCGCGTGCGG GAAAAGTCGA TGACGATGGC GGAATTGCTG 
ATCGGGTCGC GTAAAACCTA CGGTCTGAAT CTGATTGGTG GTGTTCGCCG CGATATTCTC 
AAAGAGCAAC GTCTGCAAAC GCTGAAACTG GTGCGCGAGA TGCGCGCCGA CGTGTCGGAG 
CTGGTAGAGA TGCTGCTTGC TACGCCGAAT ATGGAACAAC GCACTCAGGG CATTGGCATT 
CTCGACCGAC AAATCGCCCG TGATTTGCGC TTTGATCACC CCTACGCCGA CTACGGCAAT 
ATTCCAAAAA CACTGTTTAC CTTTACCGGC GGCGATGTTT TCTCCCGCGT GATGGTCCGT 
GTCAAAGAGA CGTTTGATTC GCTGGCAATG CTGGAATTTG CCCTCGACAA CATGCCGGAT 
ACCCCACTGC TGACCGAAGG CTTTAGCTAT AAACCTCACG CATTCGCGCT GGGCTTTGTT 
GAAGCGCCAC GCGGTGAAGA CGTGCACTGG AGCATGCTCG GTGATAACCA AAAATTGTTC 
CGCTGGCGCT GCCGTGCCGC CACCTACGCC AACTGGCCGG TGTTGCGTTA CATGCTGCGC 
GGCAATACCG TTTCTGACGC ACCGCTGATT ATCGGTAGCC TTGATCCCTG CTACTCCTGT 
ACCGACCGTG TGACGCTGGT AGATGTGCGC AAGCGCCAGT CAAAAACCGT GCCGTATAAA 
GAGATCGAAC GCTACGGCAT TGATCGTAAC CGTTCGCCGC TGAAGTAA

Protein sequence

MNVNSSSNRG EAILAALKTQ FPGAVLDEER QTPEQVTITV KINLLPDVVQ YLYYQHDGWL 
PVLFGNDERT LNGHYAVYYA LSMEGAEKCW IVVKALVDAD SREFPSVTPR VPAAVWGERE 
IRDMYGLIPV GLPDQRRLVL PDDWPEDMHP LRKDAMDYRL RPEPTTDSET YPFINEGNSD 
ARVIPVGPLH ITSDEPGHFR LFVDGEQIVD ADYRLFYVHR GMEKLAETRM GYNEVTFLSD 
RVCGICGFAH SVAYTNSVEN ALGIEVPQRA HTIRSILLEV ERLHSHLLNL GLSCHFVGFD 
TGFMQFFRVR EKSMTMAELL IGSRKTYGLN LIGGVRRDIL KEQRLQTLKL VREMRADVSE 
LVEMLLATPN MEQRTQGIGI LDRQIARDLR FDHPYADYGN IPKTLFTFTG GDVFSRVMVR 
VKETFDSLAM LEFALDNMPD TPLLTEGFSY KPHAFALGFV EAPRGEDVHW SMLGDNQKLF 
RWRCRAATYA NWPVLRYMLR GNTVSDAPLI IGSLDPCYSC TDRVTLVDVR KRQSKTVPYK 
EIERYGIDRN RSPLK