Gene EcolC_3821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3821
Symbol
ID	6065981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4177451
End bp	4178515
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	52%
IMG OID	641603233
Product	putative L-ascorbate 6-phosphate lactonase
Protein accession	YP_001726752
Protein GI	170021798
COG category	[R] General function prediction only
COG ID	[COG2220] Predicted Zn-dependent hydrolases of the beta-lactamase fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00194518
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTAAAG TGAAAAGTAT CACCCGTGAA TCCTGGATCC TGAGCACTTT CCCGGAGTGG 
GGTAGCTGGT TGAATGAAGA AATTGAACAA GAACAGGTCG CTCCTGGCAC ATTTGCGATG 
TGGTGGCTTG GCTGCACCGG GATCTGGTTG AAATCGGAAG GTGGCACCAA CGTTTGCGTT 
GATTTCTGGT GCGGCACTGG CAAACAAAGT CACGGTAACC CGTTAATGAA ACAGGGTCAC 
CAGATGCAGC GCATGGCTGG CGTGAAAAAA CTGCAGCCAA ACCTGCGTAC CACCCCGTTT 
GTTCTTGATC CGTTTGCGAT TCGCCAGATC GACGCGGTAC TGGCGACTCA CGATCACAAC 
GATCATATCG ACGTTAACGT CGCTGCTGCC GTGATGCAGA ACTGTGCTGA TGACGTACCG 
TTTATCGGAC CGAAAACCTG TGTGGATTTG TGGATTGGCT GGGGCGTACC GAAAGAGCGT 
TGCATCGTGG TCAAACCGGG CGATGTAGTA AAAGTGAAAG ACATTGAAAT TCATGCGCTT 
GATGCTTTCG ACCGTACTGC ACTGATCACC CTGCCTGCCG ATCAAAAAGC GGCTGGCGTA 
CTGCCAGATG GCATGGACGA TCGCGCGGTG AACTACCTGT TCAAAACGCC TGGCGGCTCC 
CTGTATCACA GCGGCGACTC CCACTACTCT AACTACTATG CAAAACATGG TAATGAGCAT 
CAGATCGACG TGGCTTTAGG TTCATACGGC GAAAATCCGC GTGGTATCAC CGACAAAATG 
ACCAGCGCCG ATATGCTGCG TATGGGTGAA GCGCTGAATG CGAAAGTAGT GATCCCGTTC 
CACCACGATA TCTGGTCAAA CTTCCAGGCC GATCCGCAAG AGATCCGCGT GCTGTGGGAG 
ATGAAAAAAG ATCGCCTGAA GTATGGCTTC AAGCCGTTTA TCTGGCAGGT TGGCGGCAAA 
TTTACCTGGC CGTTGGATAA AGACAACTTC GAGTACCACT ATCCGCGTGG TTTCGATGAT 
TGCTTCACTA TTGAACCGGA TCTGCCGTTC AAGTCATTCC TGTAA

Protein sequence

MSKVKSITRE SWILSTFPEW GSWLNEEIEQ EQVAPGTFAM WWLGCTGIWL KSEGGTNVCV 
DFWCGTGKQS HGNPLMKQGH QMQRMAGVKK LQPNLRTTPF VLDPFAIRQI DAVLATHDHN 
DHIDVNVAAA VMQNCADDVP FIGPKTCVDL WIGWGVPKER CIVVKPGDVV KVKDIEIHAL 
DAFDRTALIT LPADQKAAGV LPDGMDDRAV NYLFKTPGGS LYHSGDSHYS NYYAKHGNEH 
QIDVALGSYG ENPRGITDKM TSADMLRMGE ALNAKVVIPF HHDIWSNFQA DPQEIRVLWE 
MKKDRLKYGF KPFIWQVGGK FTWPLDKDNF EYHYPRGFDD CFTIEPDLPF KSFL