Gene EcHS_A2531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2531
Symbol
ID	5593481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2545849
End bp	2546961
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	52%
IMG OID	640921652
Product	IS186, transposase
Protein accession	YP_001459185
Protein GI	157161867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.0258409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTACT CTCACGATAA CTGGTCAGCA ATTCTGGCCC ATATTGGTAA GCCCGAAGAA 
CTGGATACTT CGGCACGTAA TGCCGGGGCT CTAACCCGCC GCCGCGAAAT TCGTGATGCT 
GCAACTCTGC TACGTCTGGG GCTGGCTTAC GGCCCCGGGG GGATGTCATT ACGTGAAGTC 
ACTGCATGGG CTCAGCTCCA TGACGTTGCA ACATTATCTG ACGTGGCTCT CCTGAAGCGG 
CTGCGGAATG CCGCCGACTG GTTTGGCATA CTTGCCGCAC AAACACTTGC TGTACGCGCC 
GCAGTTACGG GTTGTACAAG CGGAAAGAGA TTGCGTCTTG TCGATGGAAC AGCAATCAGT 
GCGCCCGGGG GCGGCAGCGC TGAATGGCGA CTACATATGG GATATGATCC TCATACCTGT 
CAGTTCACTG ATTTTGAGCT AACCGACAGC AGAGACGCTG AACGGCTGGA CCGATTTGCG 
CAAACGGCAG ACGAGATACG CATTGCTGAC CGGGGATTCG GTTCGCGTCC CGAATGTATC 
CGCTCACTTG CTTTTGGAGA AGCTGATTAT ATCGTCCGGG TTCACTGGCG AGGATTGCGC 
TGGTTAACTG CAGAAGGAAT GCGCTTTGAC ATGATGGGTT TTCTGCGCGG GCTGGATTGC 
GGTAAGAACG GTGAAACCAC TGTAATGATA GGCAATTCAG GTAATAAAAA AGCCGGAGCT 
CCCTTTCCGG CACGTCTCAT TGCCGTATCA CTTCCTCCCG AAAAAGCATT AATCAGTAAA 
ACCCGACTGC TCAGCGAGAA TCGTCGAAAA GGACGAGTAG TTCAGGCGGA AACGCTGGAA 
GCAGCGGGCC ATGTGCTATT GCTAACATCA TTACCGGAAG ATGAATATTC AGCAGAGCAA 
GTGGCTGATT GTTACCGTCT GCGATGGCAA ATTGAACTGG CTTTTAAGCG GCTCAAAAGT 
TTGCTGCACC TGGATGCTTT GCGTGCAAAG GAACCTGAAC TCGCGAAAGC GTGGATATTT 
GCTAATCTAC TCGCCGCATT TTTAATTGAC GACATAATCC AGCCATCGCT GGATTTCCCC 
CCCAGAAGTG CCGGATCCGA AAAGAAGAAC TAA

Protein sequence

MNYSHDNWSA ILAHIGKPEE LDTSARNAGA LTRRREIRDA ATLLRLGLAY GPGGMSLREV 
TAWAQLHDVA TLSDVALLKR LRNAADWFGI LAAQTLAVRA AVTGCTSGKR LRLVDGTAIS 
APGGGSAEWR LHMGYDPHTC QFTDFELTDS RDAERLDRFA QTADEIRIAD RGFGSRPECI 
RSLAFGEADY IVRVHWRGLR WLTAEGMRFD MMGFLRGLDC GKNGETTVMI GNSGNKKAGA 
PFPARLIAVS LPPEKALISK TRLLSENRRK GRVVQAETLE AAGHVLLLTS LPEDEYSAEQ 
VADCYRLRWQ IELAFKRLKS LLHLDALRAK EPELAKAWIF ANLLAAFLID DIIQPSLDFP 
PRSAGSEKKN