Gene EcE24377A_4129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4129
Symbol	rfaJ
ID	5586431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4119050
End bp	4120045
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	35%
IMG OID	640927748
Product	lipopolysaccharide 1,2-glucosyltransferase
Protein accession	YP_001465108
Protein GI	157154988
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0229706
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAT TTATAAAAGA ACGGTTTTCG TATTTAGCAG ATAATAAAAA AGAAAACGCC 
CCAGAGCTAA ATGTTTCCTA CGGTATCGAT AAGAATTTTT TGTATGGTGC TGGCGTTTCA 
ATTTCTTCCG TTTTGATTAA TAATTCAGAT ATTAATTTTG TCTTTCATGT TTTCACTGAT 
TATGTGGATG ATGATTATTT AAAGTCATTT AATGAAACAG CAAAACAATT TAATACCTCA 
ATTATTGTAT ATTTAATTGA CCCCAAATAC TTTGCTGATC TGCCGACGTC ACAGTTTTGG 
TCGTACGCGA CATACTTCAG GGTATTGTCT TTTGAATATC TGAGTGAAAG TATTTCCACA 
CTGCTGTATC TGGATGCCGA TGTTGTTTGT AAAGGAAGCC TGAAACCTCT CACAGAAATT 
ATATTTAAAG ATGAGTTTGC TGCGGTCATT CCTGACAATG ATAGTACTCA GGCGGCATGT 
GCAAAACGCC TCAACATTCC CGAAATGAAT GGACGTTATT TCAATGCAGG CGTTATCTAT 
GTCAATCTTA AAAAATGGCA TGAAGCAAAT TTGACACCGT ATTTACTCAA ACTTTTACGA 
GGGGAAACTA AATATGGCTC TCTTAAATAT TTAGATCAGG ATGCGTTGAA TATCGCATTT 
AATATGAATA ATATCTACCT TGCGAAGGAT TTTGATACTA TTTATACCCT GAAAAACGAA 
CTTTATGATC GTAGTCATCG AAAGTATCAG CAAACCATTA CCGATAAAAC AGTGTTGATT 
CACTATACAG GGATAACTAA ACCATGGCAT AGCTGGGCTG GATATCCGTC TGCATCATAC 
TTTAATATCG CGCGTGAACA ATCTCCCTGG AAGAAATATC CTCTTAAAGA GGCGCGGACT 
GTTGCAGAAA TGCAGAAACA ATATAAGCAT CTGTTTGCCC ATGGTGAGTA TATAAAAGGC 
ATAACTTCAT TAATTAAGTA CAAGCTTAAG AAATAA

Protein sequence

MNEFIKERFS YLADNKKENA PELNVSYGID KNFLYGAGVS ISSVLINNSD INFVFHVFTD 
YVDDDYLKSF NETAKQFNTS IIVYLIDPKY FADLPTSQFW SYATYFRVLS FEYLSESIST 
LLYLDADVVC KGSLKPLTEI IFKDEFAAVI PDNDSTQAAC AKRLNIPEMN GRYFNAGVIY 
VNLKKWHEAN LTPYLLKLLR GETKYGSLKY LDQDALNIAF NMNNIYLAKD FDTIYTLKNE 
LYDRSHRKYQ QTITDKTVLI HYTGITKPWH SWAGYPSASY FNIAREQSPW KKYPLKEART 
VAEMQKQYKH LFAHGEYIKG ITSLIKYKLK K