Gene EcolC_0522 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0522
Symbol	hflB
ID	6068720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	561425
End bp	563359
Gene Length	1935 bp
Protein Length	644 aa
Translation table	11
GC content	54%
IMG OID	641599927
Product	ATP-dependent metalloprotease
Protein accession	YP_001723526
Protein GI	170018572
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000177959
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00179189
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGAAAA ACCTAATACT CTGGCTGGTC ATTGCCGTTG TGCTGATGTC AGTATTCCAG 
AGCTTTGGGC CCAGCGAGTC TAATGGCCGT AAGGTGGATT ACTCTACCTT CCTACAAGAG 
GTCAATAACG ACCAGGTTCG TGAAGCGCGT ATCAACGGAC GTGAAATCAA CGTTACCAAG 
AAAGATAGTA ACCGTTATAC CACTTACATT CCGGTTCAGG ATCCGAAATT ACTGGATAAC 
CTGTTGACCA AGAACGTCAA GGTTGTCGGT GAACCGCCTG AAGAACCAAG CCTGCTGGCT 
TCTATCTTCA TCTCCTGGTT CCCGATGCTG TTGCTGATTG GTGTCTGGAT CTTCTTCATG 
CGTCAAATGC AGGGCGGCGG TGGCAAAGGT GCCATGTCGT TTGGTAAGAG CAAAGCGCGC 
ATGCTGACGG AAGATCAGAT CAAAACGACC TTTGCTGACG TTGCGGGCTG CGACGAAGCA 
AAAGAAGAAG TTGCTGAACT GGTTGAGTAT CTGCGCGAGC CGAGCCGCTT CCAGAAACTC 
GGCGGTAAGA TCCCGAAAGG CGTCTTGATG GTCGGTCCTC CGGGTACCGG TAAAACGCTG 
CTGGCGAAAG CGATTGCAGG CGAAGCGAAA GTTCCGTTCT TTACTATCTC CGGTTCTGAC 
TTCGTAGAAA TGTTCGTCGG TGTGGGTGCA TCCCGTGTTC GTGACATGTT CGAACAGGCG 
AAGAAAGCGG CACCGTGCAT CATCTTTATC GATGAAATCG ACGCCGTAGG CCGCCAGCGT 
GGCGCTGGTC TGGGCGGTGG TCACGATGAA CGTGAACAGA CTCTGAACCA GATGCTGGTT 
GAGATGGATG GCTTCGAAGG TAACGAAGGT ATCATCGTTA TCGCCGCGAC TAACCGTCCG 
GACGTTCTCG ACCCGGCCCT GCTGCGTCCT GGCCGTTTCG ACCGTCAGGT TGTGGTCGGC 
TTGCCAGATG TTCGCGGTCG TGAGCAGATC CTGAAAGTTC ACATGCGTCG CGTACCATTG 
GCACCCGATA TCGACGCGGC AATCATTGCC CGTGGTACTC CTGGTTTCTC CGGTGCTGAC 
CTGGCGAACC TGGTGAACGA AGCGGCACTG TTCGCTGCTC GTGGCAACAA ACGCGTTGTG 
TCGATGGTTG AGTTCGAGAA AGCGAAAGAC AAAATCATGA TGGGTGCGGA ACGTCGCTCC 
ATGGTGATGA CGGAAGCGCA GAAAGAATCG ACGGCTTACC ACGAAGCGGG TCATGCGATT 
ATCGGTCGCC TGGTGCCGGA ACACGATCCG GTGCACAAAG TGACGATTAT CCCACGCGGT 
CGTGCGCTGG GTGTGACTTT CTTCTTGCCT GAGGGCGACG CAATCAGCGC CAGCCGTCAG 
AAACTGGAAA GCCAGATTTC TACGCTGTAC GGTGGTCGTC TGGCAGAAGA GATCATCTAC 
GGGCCGGAAC ATGTATCTAC CGGTGCGTCC AACGATATTA AAGTTGCGAC CAACCTGGCA 
CGTAACATGG TGACTCAGTG GGGCTTCTCT GAGAAATTGG GTCCACTGCT GTACGCGGAA 
GAAGAAGGTG AAGTGTTCCT CGGCCGTAGC GTAGCGAAAG CGAAACATAT GTCCGATGAA 
ACTGCACGTA TCATCGACCA GGAAGTGAAA GCACTGATTG AGCGTAACTA TAATCGTGCG 
CGTCAGCTTC TGACCGACAA TATGGATATT CTGCATGCGA TGAAAGATGC TCTCATGAAA 
TATGAGACTA TCGACGCACC GCAGATTGAT GACCTGATGG CACGTCGCGA TGTACGTCCG 
CCAGCGGGCT GGGAAGAACC AGGCGCTTCT AACAATTCTG GCGACAATGG TAGTCCAAAG 
GCTCCTCGTC CGGTTGATGA ACCGCGTACG CCGAACCCGG GTAACACCAT GTCAGAGCAG 
TTAGGCGACA AGTAA

Protein sequence

MAKNLILWLV IAVVLMSVFQ SFGPSESNGR KVDYSTFLQE VNNDQVREAR INGREINVTK 
KDSNRYTTYI PVQDPKLLDN LLTKNVKVVG EPPEEPSLLA SIFISWFPML LLIGVWIFFM 
RQMQGGGGKG AMSFGKSKAR MLTEDQIKTT FADVAGCDEA KEEVAELVEY LREPSRFQKL 
GGKIPKGVLM VGPPGTGKTL LAKAIAGEAK VPFFTISGSD FVEMFVGVGA SRVRDMFEQA 
KKAAPCIIFI DEIDAVGRQR GAGLGGGHDE REQTLNQMLV EMDGFEGNEG IIVIAATNRP 
DVLDPALLRP GRFDRQVVVG LPDVRGREQI LKVHMRRVPL APDIDAAIIA RGTPGFSGAD 
LANLVNEAAL FAARGNKRVV SMVEFEKAKD KIMMGAERRS MVMTEAQKES TAYHEAGHAI 
IGRLVPEHDP VHKVTIIPRG RALGVTFFLP EGDAISASRQ KLESQISTLY GGRLAEEIIY 
GPEHVSTGAS NDIKVATNLA RNMVTQWGFS EKLGPLLYAE EEGEVFLGRS VAKAKHMSDE 
TARIIDQEVK ALIERNYNRA RQLLTDNMDI LHAMKDALMK YETIDAPQID DLMARRDVRP 
PAGWEEPGAS NNSGDNGSPK APRPVDEPRT PNPGNTMSEQ LGDK