Gene EcHS_A1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1023
Symbol
ID	5592456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1029727
End bp	1030959
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	52%
IMG OID	640920190
Product	hypothetical protein
Protein accession	YP_001457755
Protein GI	157160437
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.0437357
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCTGC CGCACCTCTC CCTTGCTGAT GCGCGTAATC TTCACCTTGC CGCACAAGGC 
CTGTTAAACA AACCCCGCCG TCGAGCGTCG TTGGAGGATA TTCCGGCAAC GATCTCCCGC 
ATGTCCTTGC TGCAAATCGA TACCATCAAT ATTGTTGCCC GTAGTCCATA TCTGGTGCTT 
TTCAGTCGTC TGGGAAATTA TCCTGCCCAG TGGCTGGATG AGTCTCTGGC GCGTGGCGAA 
TTAATGGAAT ACTGGGCGCA TGAAGCCTGC TTTATGCCGC GTAGCGACTT TCGTCTTATT 
CGCCACCGCA TGCTGGCACC TGAAAAAATG GGCTGGAAAT ACAAAGACGC CTGGATGCAG 
GAACATGAGG CGGAAATTGC ACAGTTAATT CAGCATATTC ATGATAAGGG GCCGGTACGT 
TCAGCCGATT TTGAGCATCC TCGTAAAGGT GCAAGCGGCT GGTGGGAATG GAAGCCGCAT 
AAACGGCATC TGGAAGGTTT ATTTACTGCC GGAAAGGTGA TGGTGATTGA ACGGCGCAAC 
TTCCAGCGCG TTTATGATTT AACCCACCGT GTCATGCCTG ACTGGGATGA TGAGCGCGAT 
CTCGTTTCGC AAACAGAAGC AGAAATCATC ATGCTGGATA ACAGTGCGCG TAGCCTGGGA 
ATATTCCGCG AACAGTGGCT GGCAGATTAC TATCGGCTGA AACGTCCGGC ACTGGCGGCG 
TGGCGCGAAG CGAGGGCTGA ACAGCAGCAA ATCATTGCTG TGCATGTTGA AAAATTGGGC 
AATCTTTGGC TGCATGATGA TTTGCTGCCG CTACTCGAGC GAGCGCTGGC CGGAAAGCTC 
ACTGCAACGC ACAGCGCGGT ACTTTCGCCT TTTGATCCTG TTGTCTGGGA TCGCAAACGC 
GCAGAGCAGC TTTTTGATTT TAGCTACCGG CTGGAGTGCT ATACCCCAGC GCCGAAACGC 
CAGTATGGCT ATTTTGTTCT GCCGTTATTA CATCGTGGGC AATTAGTTGG GCGAATGGAT 
GCCAAAATGC ATCGCCAGAC AGGCATCCTT GAAGTTATCT CTCTGTGGTT ACAGGAAGGT 
ATTAAACCAA CGACAACGCT GCAAAAAGGG CTACGTCAGG CGATTACTGA TTTCGCTAAC 
TGGCAGCAGG CAACGCGGGT GACATTAGGA TGCTGCCCGC AAGGCCTCTT TACTGATTGC 
CGCACCGGCT GGGAAATAGA CCCCGTCGCA TAA

Protein sequence

MSLPHLSLAD ARNLHLAAQG LLNKPRRRAS LEDIPATISR MSLLQIDTIN IVARSPYLVL 
FSRLGNYPAQ WLDESLARGE LMEYWAHEAC FMPRSDFRLI RHRMLAPEKM GWKYKDAWMQ 
EHEAEIAQLI QHIHDKGPVR SADFEHPRKG ASGWWEWKPH KRHLEGLFTA GKVMVIERRN 
FQRVYDLTHR VMPDWDDERD LVSQTEAEII MLDNSARSLG IFREQWLADY YRLKRPALAA 
WREARAEQQQ IIAVHVEKLG NLWLHDDLLP LLERALAGKL TATHSAVLSP FDPVVWDRKR 
AEQLFDFSYR LECYTPAPKR QYGYFVLPLL HRGQLVGRMD AKMHRQTGIL EVISLWLQEG 
IKPTTTLQKG LRQAITDFAN WQQATRVTLG CCPQGLFTDC RTGWEIDPVA