Gene EcHS_A0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0049
Symbol	fixC
ID	5591073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	47440
End bp	48726
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	55%
IMG OID	640919237
Product	putative oxidoreductase FixC
Protein accession	YP_001456832
Protein GI	157159514
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGAAG ATATCTTTGA CGCCATCATC GTCGGTGCTG GGCTTGCCGG TTCGGTTGCC 
GCACTGGTGC TCGCCCGCGA AGGGGCGCAA GTGTTAGTTA TCGAGCGTGG CAATTCCGCA 
GGTGCCAAGA ACGTCACCGG CGGGCGTCTC TATGCCCACA GCCTGGAACA CATTATTCCT 
GGTTTCGCCG ACTCCGCCCC CGTAGAACGC CTGATCACCC ATGAAAAACT CGCGTTTATG 
ACGGAAAAGT CAGCGATGAC TATGGACTAC TGCAATGGTG ACGAAACCTC GCCATCCCAG 
CGTTCTTACT CCGTTTTGCG CAGTAAATTT GATGCCTGGC TGATGGAGCA GGCCGAAGAA 
GCGGGCGCGC AGTTAATTAC CGGGATCCGC GTCGATAACC TCGTACAGCG CGATGGCAAA 
GTCGTCGGTG TAGAAGCCGA TGGCGATGTG ATTGAAGCGA AAACGGTGAT CCTTGCTGAT 
GGAGTGAACT CCATCCTTGC CGAAAAGCTG GGGATGGCAA AACGCGTTAA ACCGACGGAT 
GTGGCGGTTG GCGTGAAGGA ACTGATCGAG TTACCGAAGT CGGTAATCGA AGACCGTTTT 
CAGTTGCAGG GTAATCAGGG CGCGGCTTGT CTGTTTGCGG GATCACCCAC CGATGGCCTG 
ATGGGCGGCG GCTTCCTTTA TACCAATGAA AATACCCTGT CGCTGGGGCT GGTTTGTGGT 
CTGCATCATC TGCATGACGC AAAAAAATCG GTGCCGCAAA TGCTGGAAGA TTTCAAACAA 
CATCCGGCCG TTGCACCGCT GATCGCGGGT GGCAAGCTGG TGGAATATTC CGCTCACGTA 
GTGCCGGAAG CAGGCATCAA CATGCTGCCG GAGTTGGTTG GTGACGGCGT ATTGATTGCC 
GGTGATGCCG CCGGAATGTG TATGAACCTC GGTTTTACCA TTCGCGGTAT GGATCTGGCG 
ATTGCCGCCG GGGAAGCCGC AGCAAAAACC GTGCTTTCAG CGATGAAAAG CGACGATTTC 
AGTAAGCAAA AACTGGCGGA ATATCGTCAG CATCTTGAGA GTGGCCCGCT GCGCGATATG 
CGTATGTACC AGAAACTACC GGCCTTCCTT GATAACCCAC GCATGTTTAG CGGCTACCCG 
GAACTGGCGG TGGGCGTGGC GCGTGACCTG TTCACCATTG ACGGCAGTGC GCCGGAACTG 
ATGCGCAAGA AAATCCTCCG CCACGGCAAG AAAGTGGGCT TCATCAATCT GATCAAGGAT 
GGCATGAAAG GAGTGACCGT TTTATGA

Protein sequence

MSEDIFDAII VGAGLAGSVA ALVLAREGAQ VLVIERGNSA GAKNVTGGRL YAHSLEHIIP 
GFADSAPVER LITHEKLAFM TEKSAMTMDY CNGDETSPSQ RSYSVLRSKF DAWLMEQAEE 
AGAQLITGIR VDNLVQRDGK VVGVEADGDV IEAKTVILAD GVNSILAEKL GMAKRVKPTD 
VAVGVKELIE LPKSVIEDRF QLQGNQGAAC LFAGSPTDGL MGGGFLYTNE NTLSLGLVCG 
LHHLHDAKKS VPQMLEDFKQ HPAVAPLIAG GKLVEYSAHV VPEAGINMLP ELVGDGVLIA 
GDAAGMCMNL GFTIRGMDLA IAAGEAAAKT VLSAMKSDDF SKQKLAEYRQ HLESGPLRDM 
RMYQKLPAFL DNPRMFSGYP ELAVGVARDL FTIDGSAPEL MRKKILRHGK KVGFINLIKD 
GMKGVTVL