Gene EcE24377A_4130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4130
Symbol	rfaI
ID	5586429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4120062
End bp	4121078
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	38%
IMG OID	640927749
Product	lipopolysaccharide 1,3-galactosyltransferase
Protein accession	YP_001465109
Protein GI	157159286
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00481358
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCCC ACTATTTTAA TCCACAAGAG ATGATCAATA AGACAATCAT CTTCGATGAA 
AGGCCAGCGG CGTCAGTGGC ATCATCATTC CATGTTGCTT ATGGCATTGA TAAAAACTTT 
CTTTTTGGTT GTGGTGTTTC AATCACGTCA GTTTTGTTAC ATAACAACGA CGTGAGTTTT 
GTTTTCCACG TTTTTATTGA TGATATCCCT GAAGCCGATA TCCAGCGTTT AGCCCAATTG 
GCGAAAAGCT ATCGTACCTG TATCCAGATC CATCTAGTAA ATTGTGAACG GCTTAAGGCA 
TTACCGACGA CCAAAAATTG GTCTATTGCC ATGTATTTCC GTTTTGTAAT TGCAGATTAC 
TTTATTGATC AACAAGATAA GATCCTTTAC CTGGATGCTG ATATCGCCTG TCAGGGAAAC 
TTAAAGCCGC TGATAACAAT GGATCTTGCC AATAACGTTG CTGCTGTTGT TACTGAACGC 
GATGCTAACT GGTGGTCGTT ACGGGGTCAA AGTCTGCAGT GTAATGAACT TGAAAAGGGT 
TACTTTAATT CAGGTGTCCT GTTAATTAAT ACACTAGCGT GGGCGCAGGA GTCCGTTTCT 
GCTAAAGCGA TGTCGATGCT TGCTGATAAA GCCATCGTTT CCCGTTTAAC CTATATGGAT 
CAAGATATCC TTAATCTTAT CCTGTTAGGG AAAGTTAAAT TCATTGATGC TAAATACAAT 
ACGCAATTTA GTTTAAATTA TGAATTAAAA AAATCATTTG TTTGTCCAAT TAATGATGAA 
ACCGTATTAA TTCATTATGT CGGCCCGACA AAACCCTGGC ATTACTGGGC CGGTTATCCA 
AGTGCGCAAC CTTTTATCAA AGCCAAAGAA GCATCGCCCT GGAAAAATGA ACCGTTAATG 
CGGCCAGTTA ACTCAAACTA TGCTCGTTAT TGCGCCAAGC ATAATTTTAA ACAAAACAAA 
CCAATTAACG GGATAATGAA TTATATTTAT TATTTTTATT TAAAGATAAT AAAATGA

Protein sequence

MSAHYFNPQE MINKTIIFDE RPAASVASSF HVAYGIDKNF LFGCGVSITS VLLHNNDVSF 
VFHVFIDDIP EADIQRLAQL AKSYRTCIQI HLVNCERLKA LPTTKNWSIA MYFRFVIADY 
FIDQQDKILY LDADIACQGN LKPLITMDLA NNVAAVVTER DANWWSLRGQ SLQCNELEKG 
YFNSGVLLIN TLAWAQESVS AKAMSMLADK AIVSRLTYMD QDILNLILLG KVKFIDAKYN 
TQFSLNYELK KSFVCPINDE TVLIHYVGPT KPWHYWAGYP SAQPFIKAKE ASPWKNEPLM 
RPVNSNYARY CAKHNFKQNK PINGIMNYIY YFYLKIIK