Gene EcHS_A1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1539
Symbol
ID	5592268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1544277
End bp	1545338
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	50%
IMG OID	640920694
Product	hypothetical protein
Protein accession	YP_001458250
Protein GI	157160932
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTAC GTCATCTGTT TTCATCGCGC CTGCGTGGTT CATTACTGTT AGGTTCATTG 
CTTGTTGCTT CATCATTCAG TACGCAGGCC GCAGAAGAAA TGCTGCGTAA AGCGGTAGGT 
AAAGGTGCCT ACGAAATGGC TTATAGCCAG CAAGAAAACG CACTGTGGCT CGCCACTTCG 
CAAAGCCGCA AACTGGATAA AGGTGGCGTG GTTTATCGTC TTGATCCGGT CACTCTGGAA 
GTGACGCAGG CGATCCATAA CGATCTCAAG CCGTATGGTG CCACCATCAA TAACACGACT 
CAGACGTTGT GGTTTGGTAA CACCGTAAAC AGCGCGGTCA CGGCGATAGA TGCCAAAACG 
GGCGAAGTGA AAGGCCGTCT GGTGCTGGAT GATCGTAAGC GCACGGAAGA GGTGCGCCCG 
CTGCAACCGC GTGAGCTGGT AGCTGATGAT GCCACGAACA CCGTTTACAT CAGTGGTATT 
GGTAAAGAGA GCGTGATTTG GGTCGTTGAT GGCGAGAATA TCAAACTGAA AACCGCCATC 
CAGAACACCG GTAAAATGAG TACCGGTCTG GCGCTGGATA GCAAAGGCAA ACGTCTTTAC 
ACCACTAACG CTGACGGCGA ATTGATTACC ATCGACACCG CCGACAATAA AATCCTCAGC 
CGTAAAAAGC TGCTGGATGA CGGCAAAGAG CACTTCTTTA TCAACATTAG CCTTGATATC 
GCCAGGCAGC GTGCATTTAT CACCGATTCT AAAGCGGCAG AAGTGTTAGT GGTCGATACC 
CGTAATGGCA ATATTCTGGC GAAGGTTGCG GCACCGGAAT CACTGGCTGT GCTGTTTAAC 
CCAGCGCGTA ATGAAGCCTA CGTAACGCAT CGTCAGGCAG GTAAAGTCAG TGTGATTGAC 
GCGAAAAGCT ATAAAGTGGT GAAAACGTTC GATACGCCGA CTCATCCGAA CAGCCTGGCG 
CTGTCTGCCG ATGGCAAAAC GCTGTATGTC AGTGTAAAAC AAAAATCCAC TAAACAGCAG 
GAAGCTACCC AGCCGGACGA TGTGATTCGT ATTGCGCTGT AA

Protein sequence

MHLRHLFSSR LRGSLLLGSL LVASSFSTQA AEEMLRKAVG KGAYEMAYSQ QENALWLATS 
QSRKLDKGGV VYRLDPVTLE VTQAIHNDLK PYGATINNTT QTLWFGNTVN SAVTAIDAKT 
GEVKGRLVLD DRKRTEEVRP LQPRELVADD ATNTVYISGI GKESVIWVVD GENIKLKTAI 
QNTGKMSTGL ALDSKGKRLY TTNADGELIT IDTADNKILS RKKLLDDGKE HFFINISLDI 
ARQRAFITDS KAAEVLVVDT RNGNILAKVA APESLAVLFN PARNEAYVTH RQAGKVSVID 
AKSYKVVKTF DTPTHPNSLA LSADGKTLYV SVKQKSTKQQ EATQPDDVIR IAL