Gene EcHS_A1029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1029
Symbol	mukF
ID	5595112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1034657
End bp	1035979
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	53%
IMG OID	640920196
Product	condesin subunit F
Protein accession	YP_001457761
Protein GI	157160443
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG3006] Uncharacterized protein involved in chromosome partitioning
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.000114842
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAT TTTCCCAGAC AGTCCCCGAA CTGGTTGCCT GGGCCAGAAA AAATGACTTC 
TCCATCTCGC TGCCGGTAGA CCGACTCTCT TTTCTGCTGG CGGTTGCCAC GCTGAACGGC 
GAGCGTCTGG ATGGTGAGAT GAGTGAAGGC GAGCTGGTGG ATGCATTCCG CCATGTGAGT 
GATGCGTTTG AGCAAACCAG CGAAACCATC GGCGTGCGCG CCAATAACGC GATCAACGAC 
ATGGTGCGTC AACGTCTGCT GAACCGCTTT ACCAGCGAGC AGGCGGAAGG GAACGCAATT 
TACCGTCTGA CGCCGCTCGG CATCGGCATT ACTGACTACT ACATCCGTCA GCGCGAGTTT 
TCTACGCTGC GTCTTTCTAT GCAGTTGTCG ATTGTGGCGG GTGAGCTCAA ACGCGCAGCA 
GATGCCGCCG AAGAGGGCGG TGATGAATTT CACTGGCACC GTAATGTCTA TGCGCCACTG 
AAATATTCGG TAGCAGAAAT TTTCGACAGT ATCGACCTGA CGCAACGTCT GATGGACGAA 
CAGCAGCAGC AGGTGAAGGA CGATATCGCC CAGTTGCTGA ACAAAGACTG GCGGGCGGCG 
ATTTCCAGCT GTGAATTGTT GCTTTCGGAA ACTTCCGGAA CGCTGCGTGA ATTGCAGGAT 
ACGCTGGAAG CGGCAGGCGA CAAATTGCAG GCTAATCTGT TGCGCATTCA GGATGCGACG 
ATGACCCATG ACGATCTGCA TTTCGTCGAT CGTCTGGTGT TCGATCTGCA GAGCAAACTC 
GATCGTATTA TCAGTTGGGG CCAGCAATCC ATCGACTTGT GGATTGGCTA CGACCGCCAC 
GTACACAAAT TTATTCGTAC CGCGATCGAT ATGGATAAAA ACCGCGTCTT TGCTCAGCGG 
TTACGTCAGT CGGTACAAAC CTATTTTGAT GAGCCGTGGG CGCTAACTTA TGCCAATGCC 
GATCGTCTGC TGGATATGCG TGACGAAGAG ATGGCACTGC GCGATGAAGA AGTGACTGGG 
GAACTTCCTG AGGATCTGGA ATACGAAGAG TTTAACAAGA TCCGCGAACA GCTGGCGGCG 
ATCATCGAAG AACAACTTGC CGTGTACAAA ACCAGACAAG TGCCGCTGGA TCTTGGTCTG 
GTGGTACGCG AATATCTGTC ACAGTATCCG CGTGCACGTC ACTTTGACGT TGCGCGTATT 
GTTATTGATC AGGCGGTACG TCTTGGCGTA GCGCAAGCAG ATTTCACCGG ACTGCCAGCG 
AAATGGCAGC CGATTAATGA TTACGGAGCC AAGGTACAGG CGCATGTCAT CGACAAATAT 
TGA

Protein sequence

MSEFSQTVPE LVAWARKNDF SISLPVDRLS FLLAVATLNG ERLDGEMSEG ELVDAFRHVS 
DAFEQTSETI GVRANNAIND MVRQRLLNRF TSEQAEGNAI YRLTPLGIGI TDYYIRQREF 
STLRLSMQLS IVAGELKRAA DAAEEGGDEF HWHRNVYAPL KYSVAEIFDS IDLTQRLMDE 
QQQQVKDDIA QLLNKDWRAA ISSCELLLSE TSGTLRELQD TLEAAGDKLQ ANLLRIQDAT 
MTHDDLHFVD RLVFDLQSKL DRIISWGQQS IDLWIGYDRH VHKFIRTAID MDKNRVFAQR 
LRQSVQTYFD EPWALTYANA DRLLDMRDEE MALRDEEVTG ELPEDLEYEE FNKIREQLAA 
IIEEQLAVYK TRQVPLDLGL VVREYLSQYP RARHFDVARI VIDQAVRLGV AQADFTGLPA 
KWQPINDYGA KVQAHVIDKY