Gene EcHS_A3352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3352
Symbol
ID	5592806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3354374
End bp	3355381
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	56%
IMG OID	640922470
Product	hypothetical protein
Protein accession	YP_001459963
Protein GI	157162645
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03558] luciferase family oxidoreductase, group 1

Plasmid Coverage information

Num covering plasmid clones	72
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGATA AAACCATTGC GTTTTCGCTA CTCGATCTGG CCCCTATCCC CGAAGGTTCT 
TCAGCGCGAG AAGCGTTCTC CCACTCTCTC GATCTCGCCC GTCTGGCTGA AAAGCGCGGC 
TATCATCGCT ACTGGCTGGC GGAACACCAC AATATGACCG GCATTGCCAG TGCTGCAACA 
TCGGTATTAA TTGGTTATCT GGCAGCGAAT ACCACCACGC TGCATCTGGG GTCCGGTGGC 
GTGATGTTGC CTAACCACTC ACCATTGGTC ATTGCCGAAC AGTTCGGCAC GCTTAATACA 
CTCTATCCGG GGAGAATCGA TTTGGGGCTG GGCCGCGCGC CGGGTAGCGA TCAGCGAACC 
ATGATGGCAC TGCGTCGTCA TATGAGTGGC GATATTGATA ATTTCCCCCG CGATGTCGCG 
GAGCTGGTGG ACTGGTTTGA CGCCCGCGAT CCCAATCCGC ATGTGCGCCC GGTACCAGGC 
TATGGCGAGA AAATCCCCGT GTGGTTGCTA GGCTCCAGCC TTTACAGCGC GCAACTGGCG 
GCGCAGCTTG GTCTGCCGTT TGCGTTTGCC TCACACTTCG CGCCGGATAT GTTGTTCCAG 
GCGCTGCATC TTTATCGCAG CAACTTCAAA CCGTCGGCAC GACTGGAAAA ACCATACGCG 
ATGGTGTGCA TCAATATTAT CGCCGCCGAC AGCAACCGCG ACGCTGAATT TCTGTTTACC 
TCGATGCAGC AAGCTTTTGT GAAGCTGCGC CGCGGCGAAA CCGGGCAACT ACCGCCACCG 
ATTCAGAATA TGGATCAGTT CTGGTCACCG TCTGAGCAGT ATGGCGTGCA ACAGGCGCTG 
AGTATGTCGC TGGTGGGCGA TAAAGCGAAA GTGCGTCATG GCTTGCAGTC GATCCTGCGC 
GAAACCGACG CCGATGAGAT TATGGTTAAC GGGCAGATTT TCGATCACCA GGCGCGCCTG 
CATTCGTTTG AACTGGCGAT GGACGTGAAG GAAGAGTTGT TGGGATAG

Protein sequence

MTDKTIAFSL LDLAPIPEGS SAREAFSHSL DLARLAEKRG YHRYWLAEHH NMTGIASAAT 
SVLIGYLAAN TTTLHLGSGG VMLPNHSPLV IAEQFGTLNT LYPGRIDLGL GRAPGSDQRT 
MMALRRHMSG DIDNFPRDVA ELVDWFDARD PNPHVRPVPG YGEKIPVWLL GSSLYSAQLA 
AQLGLPFAFA SHFAPDMLFQ ALHLYRSNFK PSARLEKPYA MVCINIIAAD SNRDAEFLFT 
SMQQAFVKLR RGETGQLPPP IQNMDQFWSP SEQYGVQQAL SMSLVGDKAK VRHGLQSILR 
ETDADEIMVN GQIFDHQARL HSFELAMDVK EELLG