Gene Ent638_0928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_0928
Symbol	lacZ
ID	5110958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	1030947
End bp	1034033
Gene Length	3087 bp
Protein Length	1028 aa
Translation table	11
GC content	57%
IMG OID	640491105
Product	beta-D-galactosidase
Protein accession	YP_001175663
Protein GI	146310589
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3250] Beta-galactosidase/beta-glucuronidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000620353
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTACTG CATCCCCGAT GTCACTTAGC AAAATCTTAG CCCGCCGAGA CTGGGAAAAC 
CCAGGCGTGA CCCAATGGCA TCGCTTGCCT GCCCATGCCC CGTTCAATAG CTGGCGCGAT 
GAAGCATCCG CGCGGGCCGA TGATAACGCT TCCCGTAAGC GCTCGCTGAA CGGTGACTGG 
CAGTTTAGCT ATTACGCGGC ACCAGAGCAG GTGCCAGACA GCTGGGTTAC AGAAGATTGC 
GCTGACGCAG TGACGACGCC GGTTCCATCA AACTGGCAGA TGCAGGGCTT TGATACGCCC 
ATTTACACTA ACGTTACCTA TCCGATTCCG GTGAATCCAC CGTTTGTGCC AGCAGAGAAC 
CCAACCGGTT GTTACTCGCT CACATTTGAA GTGGATGAGC AGTGGCTCGA AAGCGGGCAA 
ACGCGCATTG TTTTTGATGG CGTGAACTCA GCGTTTTATC TCTGGTGCAA CGGCAAGTGG 
ATGGGCTATT CGCAGGACAG CCGCCTGCCC GCAGAGTTTG ATTTAAGCGC GGTTTTGCGC 
CCGGGAACCA ATCGTCTGGC GGTACTGGTG CTGCGCTGGT GCGACGGGAG TTATCTTGAA 
GATCAGGACA TGTGGCGGAT GAGCGGCATT TTCCGCGACG TGTCGCTGCT GCATAAACCG 
CACACCCATA TCGCGGATTA TCATGCCGTG ACGGAGCTGA ATGCTGATTA CGACCGCGCA 
AAATTACAGG TTGAAGTGGC GCTCGCTGGT GAGCAGTTTG CCGATTGCGA AGTGACGGTG 
ACCCTGTGGC GTGACGGGCT CTCAGTCGCG ACGGCCAGCG CCAAACCCGG TTCAGCCATT 
ATTGATGAGC GTGGCAATTG GGCGGAGCGT TTAAACGTCA CGTTGCCGGT GAATGATCCG 
GCACTGTGGA GCGCCGAAAC CCCGGAACTG TATCGCTTAA CCTTTGCACT GCGTGACGGG 
CAAGGTGAGA TTCTCGACGT GGAGGCTTGC GACGTCGGTT TCCGTTGCGT GGAAATCAGC 
AACGGCTTGT TAAAAGTGAA CGGAAAACCG CTGCTGATCC GTGGCGTCAA CCGCCATGAG 
CACCATCCGG AAAACGGGCA GGTGATGGAT GAAGCCACCA TGCGCCGTGA CATTGAGCTG 
ATGAAACAGC ACAACTTTAA CGCCGTGCGC TGCTCGCATT ACCCGAACCA TCCGCTGTGG 
TACACGCTGT GCGATCGGTA TGGATTGTAC GTGGTGGACG AAGCGAATAT TGAAACGCAC 
GGGATGGTGC CGATGAGCCG TCTGGCCGAC GATCCGCGCT GGCTGCCCGC GATGAGCGAA 
CGCGTGACGC GCATGGTGCT GCGCGATCGT AACCATCCGT CGATTATCAT CTGGTCACTG 
GGCAATGAAT CCGGGCACGG TGCTAACCAC GACGCGCTCT ACCGCTGGGT GAAAACCACC 
GATCCCACGC GTCCTGTGCA GTATGAAGGC GGCGGCGCGA ACACCGCTGC GACCGATATT 
GTCTGCCCGA TGTACGCCCG TGTCGATCAG GATCAACCGT TTGAAGCCGT ACCGAAATGG 
TCACTGAAAA AGTGGATCGG CATGCCGGAT GAGACGCGCC CGCTGATCCT GTGCGAATAC 
GCCCATGCCA TGGGAAACAG TTTTGGTGGA TTTGCAAAAT ACTGGCAGGC GTTTCGCAAT 
CACCCTCGCT TGCAGGGCGG ATTCGTCTGG GACTGGGTGG ATCAGGCGCT GACCAAAAAA 
GACGACAACG GCAACGCTTT CTGGGCGTAT GGCGGCGATT TTGGTGATAC ACCGAATGAT 
CGTCAGTTCT GTCTGAACGG TCTGGTGTTC CCGGATCGCA CACCGCATCC GGCGCTGTTT 
GAAGCGCAGC GCGCGCAGCA GTTTTTCAAC TTTACACTGG TCAGCACCTC ACCTCTGGTG 
ATCGACGTGC ACAGCGATTA TCTGTTCCGT CAGTGTGATA ACGAGCAGTT GCGCTGGAAT 
ATTGCCCGCG ACGGCGAAGT GCTGGCGAGC GGGGAAGTGG CGCTGACGAT TGCCCCGCAG 
CAAACGCAGC GTATTGAAAT CGACGCGCCG GAATTTGCCG CGGCGGCAGG CGAAATCTGG 
CTGAATGTGG ATATTGTCCA AACGGCGGCG ACCGCCTGGT CTCCAGCAGA TCATCGCTGC 
GCCTGGGATC AATGGCAGTT ACCCGCGCCG CTCTATATTG CGCCACCCGT TGAGGGAACG 
GCTAAGCCAG ACCTGAAGGT AAAAGAGGAT GTGCTTGAGG TCAGCCACCA GTCGCAGCGC 
TGGCACTTTG ACCGCGCCAG CGGAAATCTG ACCCAATGGT GGAATAACGG CACCGCAACG 
CTCCTCGCTC CGCTGAATGA TAATTTCACC CGTGCGCCGC TCGATAATGA TATCGGCGTC 
AGCGAAGCCA CGCGTATTGA TCCGAATGCG TGGGTTGAGC GCTGGAAAGC GGCGGGTATG 
TACAACCTCA CGCCGCGTCT GTTGCTCTGC GAAGGAGAAC AACTCGCGCA GGCTGTGACA 
ATTACCACGC TGCATGCCTG GGAATCCAAC GGTAAAGCGC TGTTCCTGAG CCGTAAGGTC 
TGGAAAATTG ACCGCGCTGG CGTGCTGCAT GGTGACGTGC AGGTGCAAGT GGCAAATGAT 
ATTCCGCAGC CCGCGCGTAT TGGCCTGAGT TGTCAGCTGG CACAAACGCC GCAAACGGCA 
AGTTGGCTGG GCCTGGGACC GGACGAGAAC TACCCGGACA GAAAGCTGGC TGCCCGTCAG 
GGACGCTGGA CGTTGCCGCT CGACGCGCTG CATACGGCGT ATATTTTCCC GACCGATAAT 
GGCCTGCGCT GCGATACGCG CGAACTGACT TTTGATACCC ATCAGCTGCA GGGCGATTTC 
CACTTTTCAT TAAGCCGCTA CAGTCAGCAA CAGCTGCGTG ATACCAGCCA TCATCATTTG 
CTGGAAGCAG AGCCGGGCTG CTGGCTCAAT ATTGACGCCT TCCATATGGG CGTGGGCGGC 
GATGACTCCT GGAGCCCAAG TGTGTCGCCG GAATTTATCC TGCAACGCCG AGAGATGCGT 
TACGCGTTTA GCTGGCGACA GGACTAA

Protein sequence

MFTASPMSLS KILARRDWEN PGVTQWHRLP AHAPFNSWRD EASARADDNA SRKRSLNGDW 
QFSYYAAPEQ VPDSWVTEDC ADAVTTPVPS NWQMQGFDTP IYTNVTYPIP VNPPFVPAEN 
PTGCYSLTFE VDEQWLESGQ TRIVFDGVNS AFYLWCNGKW MGYSQDSRLP AEFDLSAVLR 
PGTNRLAVLV LRWCDGSYLE DQDMWRMSGI FRDVSLLHKP HTHIADYHAV TELNADYDRA 
KLQVEVALAG EQFADCEVTV TLWRDGLSVA TASAKPGSAI IDERGNWAER LNVTLPVNDP 
ALWSAETPEL YRLTFALRDG QGEILDVEAC DVGFRCVEIS NGLLKVNGKP LLIRGVNRHE 
HHPENGQVMD EATMRRDIEL MKQHNFNAVR CSHYPNHPLW YTLCDRYGLY VVDEANIETH 
GMVPMSRLAD DPRWLPAMSE RVTRMVLRDR NHPSIIIWSL GNESGHGANH DALYRWVKTT 
DPTRPVQYEG GGANTAATDI VCPMYARVDQ DQPFEAVPKW SLKKWIGMPD ETRPLILCEY 
AHAMGNSFGG FAKYWQAFRN HPRLQGGFVW DWVDQALTKK DDNGNAFWAY GGDFGDTPND 
RQFCLNGLVF PDRTPHPALF EAQRAQQFFN FTLVSTSPLV IDVHSDYLFR QCDNEQLRWN 
IARDGEVLAS GEVALTIAPQ QTQRIEIDAP EFAAAAGEIW LNVDIVQTAA TAWSPADHRC 
AWDQWQLPAP LYIAPPVEGT AKPDLKVKED VLEVSHQSQR WHFDRASGNL TQWWNNGTAT 
LLAPLNDNFT RAPLDNDIGV SEATRIDPNA WVERWKAAGM YNLTPRLLLC EGEQLAQAVT 
ITTLHAWESN GKALFLSRKV WKIDRAGVLH GDVQVQVAND IPQPARIGLS CQLAQTPQTA 
SWLGLGPDEN YPDRKLAARQ GRWTLPLDAL HTAYIFPTDN GLRCDTRELT FDTHQLQGDF 
HFSLSRYSQQ QLRDTSHHHL LEAEPGCWLN IDAFHMGVGG DDSWSPSVSP EFILQRREMR 
YAFSWRQD