Gene Ent638_3016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3016
Symbol
ID	5111725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3284919
End bp	3286286
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	55%
IMG OID	640493210
Product	glycoside hydrolase family protein
Protein accession	YP_001177731
Protein GI	146312657
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.547717
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAC CCCCTTTTAT TCTGTCCATC GCCGGTGGCG GCAGTACCTA TACGCCTGGC 
ATTGTGAAAA GCCTGATGGT GCAGTTACAG GACTTTCCGC TGGCAGAAAT TCGCCTCTAT 
GATATCGATG CGGCGCGCCA GAACACCATT GCGCCAGTCG TTGAAAAAGT CATACGCGAT 
CACAGCCAGA GCATTATTTT CACCGTCACC GACGATCCAG AAGTGGCCTT CAGCGGCGCG 
CACTTTGTTT TTGCTCAGAT GCGCGTGGGT CAGTACAAAA TGCGCGAGCA GGATGAGAAG 
ATCCCACTGC GTCACGGCGT AGTCGGCCAG GAAACCTGTG GGCCGGGTGG GCTTGCCTAC 
GGACTGCGCA CAATCCTGCC GATGGTGGAA CTGATCGATC TTGTCGAGCG TTTCGCCCAT 
GAGAAGGCCT GGATTGTGAA CTACTCCAAC CCGGCGGCGA TTGTGGCAGA AGGTGTGCGC 
CGTCTGCGTC CGAACGCACG CGTGCTCAAC ATTTGCGATA TGCCGGTGGC GGCGATGCGC 
AATATGGGGG CGATTTTGGG CGTCGATCGC CACAAACTGG AAGTCGATTA CTTTGGCCTG 
AATCACTTCG GCTGGTTTAC GCGCGTGATG GTGGACGGCG TCGACAGACT GCCGGAGTTG 
CGTAGCCATA TCGCCAAATT TGGGTTGCTG ACCGAAGACG CGGCCAAAAC CGATCCGCAG 
CACTCCGATC CGTCATGGGT CAAAACCTGG CGCAACATTA AGCCGATCAT GGATAATTTC 
CCGGACTATC TGCCGAATCC GTATCTGCAG TATTACCTGA TGCCTAACCA GATCGTTGAA 
CATCAGAACC CGGATTACAC CCGCGCCAAC GAAGTGATGA ACGGGCGCGA GAAAAAGCTG 
TTCGCGGCTG CTGAAGAGTA CAAGCGTACT GGCATTTTAT CCGATGCGTT CCACGTCGGC 
GTTCACGGCG AGTTTATTGT GAATGTCGCT CGTTCGCTGG CGTTTAACCT GCGCCAGCGC 
CATCTGGTGA TGGTCGAAAA CCGTGGTGCG ATCACCAATC TGCCTTACGA TGCGGTTGTT 
GAAGTCCCGG CGTATATCAC ATCCGAAGGG CCAGAACCGA TTCGCGTCGG GCAGGTGCCG 
CTGTTCCATC AGACTTTGCT GCAGCAGCAG CTTGCGTCTG AGCAACTGTT GGTCGAAGCC 
ACTGTTGAAG GCAGCTACGA AAAAGCCCTG CAGGCCTTCA CCCTGAACCG CACGGTGCCA 
ACAATGGAAC ACGCGAAAGC GATTCTGGAT GACATGATAG AAGCTAACCG GGACTACTGG 
CCTGCGCTGC AAAAAGCCTG GCAGGACGGC GAAGCGGTGA AAAAATAA

Protein sequence

MFKPPFILSI AGGGSTYTPG IVKSLMVQLQ DFPLAEIRLY DIDAARQNTI APVVEKVIRD 
HSQSIIFTVT DDPEVAFSGA HFVFAQMRVG QYKMREQDEK IPLRHGVVGQ ETCGPGGLAY 
GLRTILPMVE LIDLVERFAH EKAWIVNYSN PAAIVAEGVR RLRPNARVLN ICDMPVAAMR 
NMGAILGVDR HKLEVDYFGL NHFGWFTRVM VDGVDRLPEL RSHIAKFGLL TEDAAKTDPQ 
HSDPSWVKTW RNIKPIMDNF PDYLPNPYLQ YYLMPNQIVE HQNPDYTRAN EVMNGREKKL 
FAAAEEYKRT GILSDAFHVG VHGEFIVNVA RSLAFNLRQR HLVMVENRGA ITNLPYDAVV 
EVPAYITSEG PEPIRVGQVP LFHQTLLQQQ LASEQLLVEA TVEGSYEKAL QAFTLNRTVP 
TMEHAKAILD DMIEANRDYW PALQKAWQDG EAVKK