Gene EcHS_A2254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2254
Symbol
ID	5595011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2248043
End bp	2250322
Gene Length	2280 bp
Protein Length	759 aa
Translation table	11
GC content	56%
IMG OID	640921384
Product	hypothetical protein
Protein accession	YP_001458920
Protein GI	157161602
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGC CGTTAATTGT CGGCATCCGG CATCATAGTC CGGCCTGCGC CCGGCTGGTG 
AAATCGTTAA TCGAAAGCCA GCGGCCACGA TACGTGTTGA TTGAAGGCCC GGCTGATTTT 
AATGACCGGG TAGACGAACT GTTTTTAGCC CACCAGCTTC CGGTAGCTAT TTACAGTTAT 
TGCCAGTATC AGGACGGTGC AGCCCCCGGG CGTGGTGCCT GGACGCCATT TGCTGAATTT 
TCGCCGGAGT GGCAGGCGCT ACAAGCCGCA CGTCGCATTC AGGCACAAAC TTACTTCATC 
GATTTGCCTT GCTGGGCGCA GAGTGAAGAA GAGGACGATT CGCCTGATAC GCAAGATGAA 
AGCCAGGCCT TACTGCTGCG TGCCACCCGC ATGGATAACA GCGATACCCT GTGGGATCAC 
TTGTTCGAAG ATGAAAGCCA GCAAACTGCA TTACCCTCTG CGCTGGCGCA CTATTTTGCC 
CAACTGCGGG GCGACGCCTC CGGCGATGCG CTCAATCGTC AGCGCGAAGC CTTTATGGCC 
CGCTGGATTG GATGGGCGAT GCAGCAAAAT AATGGCGACG TGTTAGTTGT CTGCGGTGGC 
TGGCACGCTC CGGCACTGGC AAAGATGTGG CGCGAATGCC CTCAGAAAAT TAACAAGCCA 
GAATTGCCCT CGCTGGCAGA TGCCGTTACA GGTTGTTATC TCACACCCTA CAGTGAAAAG 
CGCCTTGATG TGCTGGCAGG ATACCTTTCA GGAATGCCTG CCCCGGTATG GCAAAACTGG 
TGCTGGCAGT GGGGCTTGCA GAAGGCCGGT GAACAACTGC TAAAAACTAT CCTTACCCGT 
TTGCGCCAGC ACAAATTGCC CGCTTCTACC GCGGATATGG CTGCCGCTCA TCTGCATGCG 
ATGGCGCTGG CACAGTTGCG CGGTCATACA CTACCGTTAC GCACTAACTG GCTGGATGCC 
ATAGCAGGCT CGCTGATTAA AGAAGCCCTG AACGCGCCGT TGCCGTGGAG CTATCGCGGC 
GTTATTCATC CCGATACCGA TCCGATTCTG CTAACGTTGA TAGACACATT AGCGGGTGAC 
GGATTCGGTA AACTTGCCCC TTCTACGCCA CAACCGCCTC TGCCAAAAGA TGTCACCTGC 
GAACTGGAAC GTACCGCAAT CTCCCTTCCG GCGGAGCTTA CCTTAAATCG CTTTACCCCC 
GATGGGCTGG CGCAAAGTCA GGTGTTACAT CGGCTGGCAA TACTGGAGAT CCCTGGGATT 
GTACGCCAGC AGGGAAGTAC ACTGACACTT GCAGGCAACG GTGAAGAACG CTGGAAATTA 
ACCCGCCCGC TTAGCCAGCA TGCGGCATTG ATTGAGGCCG CCTGTTTTGG TGCCACACTC 
CAGGAAGCCG CACGCAATAA ATTAGAAGCC GATATGCTGG ACGCGGGCGG AATCGGCAGT 
ATCACCACAT GTCTTAGCCA GGCGGCGTTA GCGGGTCTGG CGTCCTTCAG TCAACAATTA 
CTGGAGCAAC TCACACTATT AATCGCCCAG GAAAATCAAT TTGCCGAAAT GGGCCAGGCG 
CTGGAAGTGC TATATGCCTT ATGGCGGCTG GATGAAATTA GCGGTATGCA AGGCGCGCAG 
ATATTACAAA CGACGTTATG CGCGGCTATC GATCGCACGC TGTGGCTGTG TGAATCTAAC 
GGCAGACCGG ATGAAAAGGA GTTTCACGCT CACCTGCATA GCTGGCAAGC GCTTTGCCAT 
ATCCTGCGCG ATCTACATAG CGGCGTTAAT TTACCCGGCG TTTCTCTTTC TGCGGCGGTA 
GCCTTACTGG AGCGACGCAG TCAGGCGATT CATGCCCCGG CGCTGGATCG CGGCGCGGCT 
CTTGGCGCAC TAATGCGTCT GGAACATCCC AACGCCAGTG CCGAAGCGGC GCTGACGATG 
CTGGCGCAGT TATCCCCGGC ACAATCCGGT GAGGCGCTGC ACGGTTTGCT GGCATTAGCC 
CGTCATCAAC TGGCCTGTCA ACCTGCATTT ATCGCCGGTT TCAGCAGTCA TTTAAATCAA 
CTAAGTGACG ACGATTTTAT TAACGCCCTG CCCGATTTAC GCGCGGCAAT GGCCTGGCTA 
CCGCCACGAG AACGCGGGAC GCTGGCGCAT CAGGTGCTTG AGCATTACCA GCTTGCGCAG 
CTTCCTGTTT CAGCGCTGCA AATGCCGTTG CATTGTCCAC CACAGGCCAT TGCACATCAT 
CAACAACTCG AACAGCAGGC ACTGGCATCG CTGCAACACT GGGGAGTTTT CCATGTCTGA

Protein sequence

MSEPLIVGIR HHSPACARLV KSLIESQRPR YVLIEGPADF NDRVDELFLA HQLPVAIYSY 
CQYQDGAAPG RGAWTPFAEF SPEWQALQAA RRIQAQTYFI DLPCWAQSEE EDDSPDTQDE 
SQALLLRATR MDNSDTLWDH LFEDESQQTA LPSALAHYFA QLRGDASGDA LNRQREAFMA 
RWIGWAMQQN NGDVLVVCGG WHAPALAKMW RECPQKINKP ELPSLADAVT GCYLTPYSEK 
RLDVLAGYLS GMPAPVWQNW CWQWGLQKAG EQLLKTILTR LRQHKLPAST ADMAAAHLHA 
MALAQLRGHT LPLRTNWLDA IAGSLIKEAL NAPLPWSYRG VIHPDTDPIL LTLIDTLAGD 
GFGKLAPSTP QPPLPKDVTC ELERTAISLP AELTLNRFTP DGLAQSQVLH RLAILEIPGI 
VRQQGSTLTL AGNGEERWKL TRPLSQHAAL IEAACFGATL QEAARNKLEA DMLDAGGIGS 
ITTCLSQAAL AGLASFSQQL LEQLTLLIAQ ENQFAEMGQA LEVLYALWRL DEISGMQGAQ 
ILQTTLCAAI DRTLWLCESN GRPDEKEFHA HLHSWQALCH ILRDLHSGVN LPGVSLSAAV 
ALLERRSQAI HAPALDRGAA LGALMRLEHP NASAEAALTM LAQLSPAQSG EALHGLLALA 
RHQLACQPAF IAGFSSHLNQ LSDDDFINAL PDLRAAMAWL PPRERGTLAH QVLEHYQLAQ 
LPVSALQMPL HCPPQAIAHH QQLEQQALAS LQHWGVFHV