Gene EcE24377A_F0045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_F0045
Symbol
ID	5585673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009786
Strand	-
Start bp	37062
End bp	38150
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	42%
IMG OID	640913763
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_001451413
Protein GI	157149369
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAC TATTTACGGA ATCATCACCG AATATAGGTG GTCAGGAATT ACAGGCTGTT 
GCTCAAATGA AGGCCCTGAA GAAAATGGGG CATTCAGTTC TGCTTGTCTG CAGGGAGAAC 
AGCAAAATTG CTTTTGAAGC CAGTAAGTTT GGAATTGATA TCACATTCGC GTTATTTCGA 
AACAGTCTTC ACATTCCTAC TGTATGGAGA TTACTCGGAA TAGTTCATAG TTTTCAGCCC 
GATGCAATCG TTTGTCACAG TGGACATGAT AGTAATATTG TTGGTTTGGT ACGGTTTTTT 
ACCTGGAAAC ATCCATTCAG AATTATCAGG CAAAAGACAT ATTTGACACG AAAAACAAAA 
TTTTTTTCAA TAAATCATTT TTGCGATGAG GTGATTGTTC CCGGAACAAA TATGAAGACA 
CATATGGAGC AGGAAGGATG TCGAACTCGG GTTACTGTTG TGCCTCCTGG CTTTGATTTC 
CAGGAATTAT ACGTTGATTC CCGAAACAGT TTGCCTCCGA GTGTTCTTTC CTGGCTGGCG 
TCCCGAAGAG GATGCCCCGT AATTGCTCAG GTAGGAATGT TGCGCCCGGA AAAAGGGCAC 
GAATTTATGT TGAATTTACT GTTCCATTTA AAAATGAATG GACGACAGTT CTGTTGGTTG 
ATTGTGGGGT CTGGTTCACC TGAACTGCGG AAACATTTAC AGTATCAGAT TGACAGTATG 
GGCATGCATG ATGATGTTTT TATTGCTGAC AATATTTTTC CTGCCGCCCC CGTATATCGG 
GTTGCCAGTC TGGTGGTTCT GCCTTCAGAA AACGAATCTT TTGGTATGGT GCTGGCAGAA 
GCATCGGCAT TTTCTGTGCC TGTAGTGGCC ACTCAGATTG GTGGAATCCC TGAGGTTATT 
CAGAACAACC AGACCGGGAC ATTGTTACCA GCAGGTAATA AGCACGCATG GATGTGCGCC 
CTGAATGATT TTTTTAATGA CCCTGGGCGT TTTTATCAGA TGGCTCGCCT GGCAAAACAG 
GATATAGAAG AGCGGTTTGA TATTAATAAA ACTGCGTTAA AAATACTCAC ATTAGCGAAG 
CAAAAGTAA

Protein sequence

MNILFTESSP NIGGQELQAV AQMKALKKMG HSVLLVCREN SKIAFEASKF GIDITFALFR 
NSLHIPTVWR LLGIVHSFQP DAIVCHSGHD SNIVGLVRFF TWKHPFRIIR QKTYLTRKTK 
FFSINHFCDE VIVPGTNMKT HMEQEGCRTR VTVVPPGFDF QELYVDSRNS LPPSVLSWLA 
SRRGCPVIAQ VGMLRPEKGH EFMLNLLFHL KMNGRQFCWL IVGSGSPELR KHLQYQIDSM 
GMHDDVFIAD NIFPAAPVYR VASLVVLPSE NESFGMVLAE ASAFSVPVVA TQIGGIPEVI 
QNNQTGTLLP AGNKHAWMCA LNDFFNDPGR FYQMARLAKQ DIEERFDINK TALKILTLAK 
QK