Gene EcHS_A1032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1032
Symbol
ID	5592393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1041385
End bp	1043232
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	53%
IMG OID	640920199
Product	hypothetical protein
Protein accession	YP_001457764
Protein GI	157160446
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGCTTA ATATGATGTG TGGTCGTCGG CTGTCGGCAA TCAGTTTGTG CCTGGCCGTA 
ACATTCGCTC CACTGTTCAA TGCGCAGGCC GATGAGCCTG AAGTAATCCC TGGCGACAGC 
CCGGTGGCTG TCAGTGAACA GGGCGAGGCA CTGCCGCAGG CGCAAGCCAC GGCAATAATG 
GCGGGGATCC AGCCATTGCC TGAAGGTGCG GCAGAAAAAG CCCGCACGCA AATCGAATCT 
CAATTACCCG CAGGTTACAA GCCGGTTTAT CTTAACCAGC TTCAACTGTT GTATGCCGCA 
CGCGATATGC AACCCATGTG GGAAAACCGT GATGCTGTTA AAGCCTTCCA GCAACAGCTG 
GCAGAGGTGG CGATTGCCGG TTTCCAGCCG CAGTTTAATA AATGGGTAGA GTTACTGACC 
GATCCTGGTG TTAACGGGAT GGCACGCGAC GTGGTGCTCT CTGATGCGAT GATGGGCTAT 
CTCCATTTCA TTGCAAATAT TCCGGTCAAA GGCACTCGCT GGCTATATAG CAGTAAACCT 
TATGCACTTG CAACGCCGCC GCTCTCGGTG ATTAACCAAT GGCAGCTGGC GCTGGATAAA 
GGTCAATTGC CTACGTTTGT TGCAGGACTG GCACCGCAGC ATCCGCAATA TGCGGCGATG 
CATGAATCGT TACTGGCCTT ACTCTGTGAC ACCAAACCGT GGCCCCAACT GACCGGCAAA 
GCAACGTTGC GCCCAGGGCA GTGGAGTAAC GACGTACCGG CGTTGCGCGA AATATTGCAA 
CGCACAGGCA TGTTGGACGG GGGGCCGAAA ATTACTCTAC CTGGCGATGA CACGCCAACT 
GACGCGGTAG TCAGCCCATC CGCTGTTACT GTTGAAACAG CAGAAACTAA GCCGATGGAT 
AAGCAAACGA CGTCTCGTAG TAAACCTGCG CCTGCCGTTC GCGCCGCCTA CGATAATGAA 
CTGGTGGAAG CCGTTAAACG TTTTCAGGCA TGGCAAGGAT TGGGGGCAGA TGGTGCTATT 
GGCCCGGCAA CACGTGACTG GTTAAACGTA ACGCCCGCCC AGCGTGCTGG CGTGTTGGCT 
CTCAACATCC AGCGATTGCG CTTGCTGCCA ACAGAGCTTT CTACCGGGAT CATGGTTAAC 
ATTCCGGCCT ATTCGCTGGT CTACTATCAG AACGGCAATC AGGTGCTGGA TTCGCGAGTC 
ATTGTCGGTC GCCCCGATCG CAAAACGCCG ATGATGAGCA GTGCCCTTAA CAACGTAGTG 
GTAAACCCGC CGTGGAACGT ACCTCCAACT CTGGCACGCA AAGATATTCT GCCAAAAGTG 
CGCAACGATC CGGGATATCT CGAAAGCCAT GGCTATACGG TGATGCGCGG CTGGAACAGC 
AGAGAAGCGA TTGACCCATG GCAGGTTGAC TGGTCTACAA TCACGGCCTC GAATTTACCG 
TTCCGCTTCC AGCAGGCTCC AGGCCCACGG AACTCGCTGG GGCGCTATAA ATTCAATATG 
CCGAGTTCAG AGGCCATTTA TTTGCATGAC ACGCCGAACC ACAATCTGTT CAAGCGTGAT 
ACACGCGCAT TGAGCTCAGG CTGTGTACGA GTGAATAAAG CTTCCGATCT GGCGAATATG 
CTGTTGCAGG ATGCAGGCTG GAATGACAAA CGTATTTCTG ATGCGCTGAA GCAGGGTGAT 
ACACGTTACG TCAATATTCG GCAGTCGATT CCGGTGAATC TCTACTACCT GACGGCCTTT 
GTTGGTGCAG ATGGTCGTAC CCAGTATCGT ACAGATATTT ACAATTATGA TCTGCCTGCG 
CGATCCAGCT CGCAAATCGT ATCGAAAGCG GAACAATTAA TCAGGTAA

Protein sequence

MLLNMMCGRR LSAISLCLAV TFAPLFNAQA DEPEVIPGDS PVAVSEQGEA LPQAQATAIM 
AGIQPLPEGA AEKARTQIES QLPAGYKPVY LNQLQLLYAA RDMQPMWENR DAVKAFQQQL 
AEVAIAGFQP QFNKWVELLT DPGVNGMARD VVLSDAMMGY LHFIANIPVK GTRWLYSSKP 
YALATPPLSV INQWQLALDK GQLPTFVAGL APQHPQYAAM HESLLALLCD TKPWPQLTGK 
ATLRPGQWSN DVPALREILQ RTGMLDGGPK ITLPGDDTPT DAVVSPSAVT VETAETKPMD 
KQTTSRSKPA PAVRAAYDNE LVEAVKRFQA WQGLGADGAI GPATRDWLNV TPAQRAGVLA 
LNIQRLRLLP TELSTGIMVN IPAYSLVYYQ NGNQVLDSRV IVGRPDRKTP MMSSALNNVV 
VNPPWNVPPT LARKDILPKV RNDPGYLESH GYTVMRGWNS REAIDPWQVD WSTITASNLP 
FRFQQAPGPR NSLGRYKFNM PSSEAIYLHD TPNHNLFKRD TRALSSGCVR VNKASDLANM 
LLQDAGWNDK RISDALKQGD TRYVNIRQSI PVNLYYLTAF VGADGRTQYR TDIYNYDLPA 
RSSSQIVSKA EQLIR