Gene EcHS_A4030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4030
Symbol
ID	5591743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4022267
End bp	4023736
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	49%
IMG OID	640923134
Product	putative lipoprotein
Protein accession	YP_001460600
Protein GI	157163282
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACTATC GCAATGTGGT TTGTTTGTTG TCTTGTTCAT TGTTCTTATC ATCGGCATGG 
GGATGTCGGC TTGATGAGCC GGAACATAAT ATTTACCAGA AACAAGGAAA AGGCGTGGTG 
TACCTGCGCC CTTATGAAAA GACCAATCTT TCGCTACCGC AGATTAACTA CAAGCGTCTG 
CGTCTGTTAC CGAATTTGTT AATTGACCCA ACAAAACTGA AGGATTGGGA AACGGTGCCC 
CCGGCTACTG ATCTCACGAC AGACGTTGTC TACAGCGGCG CAAACGCAAC TCTTCCCCAT 
TACTCTTACT ATAGCGATGG TCGCGCTATT CTCTACGCTG GCGAGATTGT GCAAAACCCT 
CCAGGCACAC CGCCAGTCGA TATCTCGTCA TTTCAGGCAT GGGGTGATTT TGCCGCAGAT 
AAGTACAGCC TCTATTACGA AGGCAAACGC ACCGATAGCA ACCAGCAACT AAACCGCCGA 
ACGTTGCGTC AGGTAGAATT TAACCCGCAA TGGAAACCAG ACTGGCTAGG TTTGATTCTC 
CGTGACAAGC ATTATCTTTA CGCAAATGGT CAGCGCCTTG ATGATCCTGA CACCTTTACG 
GTACTGGCAC AAAAATCATG GGATCAGCGC GGTAAATTCT CTACAGCATT CAATCCCTGC 
CTTCCTGCCC CATTTGGCCC CTGGGATACC CTGGCTCGTA CACGGACCAA AATCCTGATC 
AACAGCGAAC AGCTTGATGC CGACCCGAAC ACCTTTTCCG TCGTACGCTG GATGCCCGGC 
TCACTCTTGA CCTGGCGTGA TAAAAACGGG CTACAGCGTA AAGTCCTCGA CAAGGAAAAT 
CTGGCGTGGG ATGAAGATTT AACAAAGCAC TGTCTGGATT TTTCTCTGCT GGAAAAGAAA 
GTGTTCTGGC GTAAAGGGCC TGCTTGTAAA CAGGAAGAAT TACCCGGACT CGATCCGGAA 
CAGTTTCACC CCATCAGTGA TGCTGTCGCC CAGTATCAGG ACTCGCTTTA TACCATCATC 
GAAACAGAGT CTGGTGACCG CAAGCTGGAG ATCGTGAAAC TTGATGATCC CAATCTTATT 
ATCAACAAAC GTTTCAACGC CGGGAAACGC CACGGCTATT TACTTACGCG TGCCGAAGGG 
TGGCCATACC ATTCCGGTTT ACACGTGTTT GAATCTGACG GACCGCTGAT CTTACTGGAT 
AACCACTCTC CGGATGAACG CGAAGCCCAT CTTAATGACC ATCCCTTTTT GCGCAGATGG 
TATGCCCGCG ATAACCGCTA CGTTTACAGC TTTGATGGCG CGCAGCTCTG GCGATACCGC 
ACCGCTGATC CGAAACAAGT TCGCTTAATC TGGAAGGAAC AACATTCGGG ATATGGCTAT 
GGCGTAAATT ACAAAACGGG ATATCTGGAC GGAAAAATTA CTGATGACGG CGAATTTATT 
CCTGCCCCGC GCAATGAGGC GACAAAATGA

Protein sequence

MHYRNVVCLL SCSLFLSSAW GCRLDEPEHN IYQKQGKGVV YLRPYEKTNL SLPQINYKRL 
RLLPNLLIDP TKLKDWETVP PATDLTTDVV YSGANATLPH YSYYSDGRAI LYAGEIVQNP 
PGTPPVDISS FQAWGDFAAD KYSLYYEGKR TDSNQQLNRR TLRQVEFNPQ WKPDWLGLIL 
RDKHYLYANG QRLDDPDTFT VLAQKSWDQR GKFSTAFNPC LPAPFGPWDT LARTRTKILI 
NSEQLDADPN TFSVVRWMPG SLLTWRDKNG LQRKVLDKEN LAWDEDLTKH CLDFSLLEKK 
VFWRKGPACK QEELPGLDPE QFHPISDAVA QYQDSLYTII ETESGDRKLE IVKLDDPNLI 
INKRFNAGKR HGYLLTRAEG WPYHSGLHVF ESDGPLILLD NHSPDEREAH LNDHPFLRRW 
YARDNRYVYS FDGAQLWRYR TADPKQVRLI WKEQHSGYGY GVNYKTGYLD GKITDDGEFI 
PAPRNEATK