Gene EcHS_A4528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4528
Symbol
ID	5592200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4534995
End bp	4536170
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	37%
IMG OID	640923624
Product	hypothetical protein
Protein accession	YP_001461064
Protein GI	157163746
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.179172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACAA ACCCAGAGAA GTGTATTTTT TGTGATATTC CCTTTGATAA AGGTAGCCTA 
GAGCATGTAT TCCCTAGTGC GTTAGGTGGA AGAATTACCA CAACACATGC GACATGCAAA 
AGTTGCAACA ATTTATTTTC AGAAGCGAGT TCAGATGCGG TTGAGATCGC TCTGGCTGAT 
AACTTTATTT ATATCAGGAA TGCTTTGAAT GTTTGGTCTG GAAGAGGAAA CCCACCACCA 
ACAATAAAGG AAGCAGGTCA GTTTGATGAT GGCATCAAGT ATGATCTCGC ACCAAACTTG 
ACACCTATTG TGTCTAAGTC AAGAATACCC TCAAAAGATG AAACTGATAG CAATACAGTC 
TTTGATTTCG TTGCTCAAGA TGTAGGTGAT GCTAATAGGA TTGTAGGAAT TCTTAAGAAG 
CGCGGCCTTA ATATAGGGGA TATTAATGCA AAATATGTTA CAACTAAGGC TCCTGTTATA 
AGAGCTAGCA TTAAGTTTGA AGGAAATAAG ATTTTTCGTG CTATAGCGAA AATTGCTGTA 
GTCTCCTATG TTGTTTTGTA TGGCAATTCG CGAGCAAGAA CCGATATCTA TCAGAGCCTT 
AGGGGATCCA TACGAAGTGG AGAACCTGAC ATTACAAAAT ATTGCGGATG GGACTATACA 
AATGATTTTC CTGTCATTAC AAATTTACAC CCACACGAAA AAACCCCAGA CGCCATTCAA 
TGTGGTTTTG AACACACTGT ATTTATAACT AATGTAAATC ACCAATTGGT TGCTTATATA 
AAGCTTTTTG GTGCATTTAA TTTCTCTATT ATTTTAGGTA ATCATTCGAG TATATCACCT 
AAATGCTTGT GCTTAAATCC TACAGCAGGA AAATCCTCAA GGTTTAACGT TTTATTTAAC 
CCGCCATTAA GTTACATACC TAAAAATATT GACTCATTCA AAATTGAACA TGAATCCGTT 
AGGAAACATG TTCAGTTAGC AATGAGTTCT ATAGTAGAGC ACTGTCAAAG TTTATCGACC 
GAAGAATATA TTAGAAGCCT CAGCCAAGAG TTAATGATTT CTGTTCAAAC TGCATCCGTT 
GACTCTGACA TATCTGAAAT AATCAGATCA TTTTCAGAGA AGCTTGCTCA TATAGAAAAT 
GGATTGGCGT GGGAAGAAGA AATTAATATT GAATAA

Protein sequence

MQTNPEKCIF CDIPFDKGSL EHVFPSALGG RITTTHATCK SCNNLFSEAS SDAVEIALAD 
NFIYIRNALN VWSGRGNPPP TIKEAGQFDD GIKYDLAPNL TPIVSKSRIP SKDETDSNTV 
FDFVAQDVGD ANRIVGILKK RGLNIGDINA KYVTTKAPVI RASIKFEGNK IFRAIAKIAV 
VSYVVLYGNS RARTDIYQSL RGSIRSGEPD ITKYCGWDYT NDFPVITNLH PHEKTPDAIQ 
CGFEHTVFIT NVNHQLVAYI KLFGAFNFSI ILGNHSSISP KCLCLNPTAG KSSRFNVLFN 
PPLSYIPKNI DSFKIEHESV RKHVQLAMSS IVEHCQSLST EEYIRSLSQE LMISVQTASV 
DSDISEIIRS FSEKLAHIEN GLAWEEEINI E