Gene EcHS_A3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3831
Symbol	rfaF
ID	5593281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3826484
End bp	3827530
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	54%
IMG OID	640922943
Product	ADP-heptose:LPS heptosyltransferase II
Protein accession	YP_001460421
Protein GI	157163103
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000000276456
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAC TGGTGATCGG CCCGTCTTGG GTTGGCGACA TGATGATGTC GCAAAGTCTC 
TATCGCACGC TCCAGGCGCG CTATCCCCAG GCGATAATCG ATGTGATGGC ACCGGCATGG 
TGCCGTCCAT TATTATCGCG GATGCCGGAA GTTAACGAAG CTATCCCTAT GCCTCTCGGT 
CACGGAGCGC TGGAAATCGG CGAACGCCGC AAACTGGGTC ATAGCCTGCG TGAAAAGCGC 
TACGACCGCG CCTACGTCTT ACCAAACTCC TTCAAATCTG CATTAGTGCC TTTCTTCGCG 
GGTATTCCTC ATCGCACTGG CTGGCGCGGC GAGATGCGCT ACGGTTTACT CAACGATGTA 
CGCGTGCTCG ATAAAGAAGC CTGGCCGCTA ATGGTGGAAC GCTATGTCGC GCTGGCCTAT 
GACAAAGGCA TTATGCGTAC CGCACAAGAT CTGCCGCAGC CATTGTTATG GCCGCAGTTG 
CAGGTGAGCG AAGGTGAAAA ATCATATACC TGTAATCAAT TTTCGCTTTC ATCAGAACGT 
CCGATGATTG GCTTTTGCCC GGGTGCGGAG TTTGGTCCGG CAAAACGCTG GCCACACTAC 
CACTATGCGG AGCTGGCAAA GCAGCTGATT GATGAAGGTT ATCAGGTGGT TCTGTTTGGC 
TCTGCGAAAG ATCATGAAGC GGGCAATGAG ATTCTTGCCG CTTTGAATAC CGAGCAGCAG 
GCATGGTGTC GGAACCTGGC GGGGGAAACA CAGCTTGATC AAGCGGTTAT CCTGATTGCA 
GCCTGTAAAG CCATTGTCAC TAACGATTCT GGCCTAATGC ACGTTGCGGC GGCGCTCAAT 
CGTCCGCTGG TTGCCCTGTA TGGTCCGAGT AGCCCGGACT TCACACCGCC GCTATCCCAT 
AAAGCGCGCG TGATCCGTCT GATTACCGGC TATCACAAAG TGCGTAAAGG TGACGCTGCG 
GAGGGTTATC ACCAGAGCTT GATCGACATT ACTCCCCAGC GCGTACTGGA AGAACTCAAC 
GCGCTATTGT TACAAGAGGA AGCCTGA

Protein sequence

MKILVIGPSW VGDMMMSQSL YRTLQARYPQ AIIDVMAPAW CRPLLSRMPE VNEAIPMPLG 
HGALEIGERR KLGHSLREKR YDRAYVLPNS FKSALVPFFA GIPHRTGWRG EMRYGLLNDV 
RVLDKEAWPL MVERYVALAY DKGIMRTAQD LPQPLLWPQL QVSEGEKSYT CNQFSLSSER 
PMIGFCPGAE FGPAKRWPHY HYAELAKQLI DEGYQVVLFG SAKDHEAGNE ILAALNTEQQ 
AWCRNLAGET QLDQAVILIA ACKAIVTNDS GLMHVAAALN RPLVALYGPS SPDFTPPLSH 
KARVIRLITG YHKVRKGDAA EGYHQSLIDI TPQRVLEELN ALLLQEEA