Gene Ent638_3965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3965
Symbol
ID	5114685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	4296573
End bp	4298036
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	53%
IMG OID	640494179
Product	glycoside hydrolase family protein
Protein accession	YP_001178671
Protein GI	146313597
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.300617
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAT CCCTCCCGTT CCCGCAAGGT TTTTTATGGG GCGGCGCAAT TGCCGCTAAT 
CAGGCCGAAG GGGCCTGGAA CGTTGATGGC AAAGGACCGT CGGTGGCGGA TGCCATCACC 
TGGAAACCCA ATCTGTCGCT GAAAGATTAT GACGGCCACA TGGCGCTGAC GGATGAAAAT 
ATTCAGGATG CGTTTGAAGG CAAAAACGAC ACACTTTACC CGAAACGTCG CGGCATCGAT 
TTCTATCACC ACTATAAAGA CGATATCGCG CTGTTTGCCG AGATGGGCTT TAAAGTGCTG 
CGCGTGTCCA TTGCCTGGTC ACGTATTTTC CCGGACGGCG AAGACGCGGC GCCGAATGAA 
GCGGGCCTGC AATTTTACGA AGAGATGTTC CGTGAACTGC GTCGCCATCA CATCGAGCCG 
CTGGTGACGC TTTCTCACTA CGAAATGCCG CTGGCGCTGA GTGAGCGATA TAACGGCTGG 
GTGCACCGCA ACGTGGTGGA CGCGTTCGTG CGCTTCAGCA ATGTCTGCTT CGACCGCTAT 
AAAGATCTGG TGCGCTACTG GCTCACGTTT AACGAAATCG ACAGCATCCA CCGCCACCCG 
TTTACCACCG CCGGTATCCG CGAAGAGAAA AGCGCGCCGG GCAAAGCGAA ACAGGATATT 
TATCAGGGGC TGCATCATCA GTTTGTCGCC TCGGCGCTGG TCACCCGTGA CTGCCACGCC 
AAAATCCCTG GCAGCCAGGT CGGGTGTATG CTGACCAAAC TCACCACCTA TCCGCACAGC 
TGCCGCCCGG AAGACGTTGA AGCGACGCTG AAAAAGAATC TCGAAAACTA TTTCTATGCG 
GATGTGCAGG TCTTTGGGGA ATATCCGCCG CTGATCCTGC GCGATCTGGC GAGCCGCGAT 
ATTCAGATTG AAATGCAAGC CGACGATCAG CGCATTTTAA AAGATCATAC CGTCGATTTC 
GTCTCGTTCA GTTACTACAT GTCGCTGACC GAATCGACGC AGCCGGACGT GGAACGCATC 
CCGGGTAACA CCATTCTTGG GGTGAAAAAC CCGTATCTGC CTGCGTCTGA ATGGGGCTGG 
CAAATCGATC CGGTCGGGCT AAAAATTTCC CTGCTCGAAC TGTACGACCG TTACCAAAAG 
CCGCTGTTTA TCGTTGAAAA CGGGCTGGGT GCGAAGGATA TCGTTGAAGA TGGCAAGATT 
CACGACAGCT ACCGCATCGA CTATTTCCGC GCCCATTTCG AGCAAACTTT GGCGGCTATC 
AATGAAGGGG TGGATGTGAT GGGATTCACC ACCTGGGGAT GCATCGACAT TATTAGCGCA 
GGCACGTCCC AGATGTCCAA GCGCTATGGC TTTATCTATG TCGATCAGGA TGATGAAGGC 
AACGGCACGT TAAAGCGCCT GAAAAAAGAT TCTTTTGGGT GGTATCAGAA AGTGATCGCC 
AGCAATGGCG CTGACATGAG CTAA

Protein sequence

MDKSLPFPQG FLWGGAIAAN QAEGAWNVDG KGPSVADAIT WKPNLSLKDY DGHMALTDEN 
IQDAFEGKND TLYPKRRGID FYHHYKDDIA LFAEMGFKVL RVSIAWSRIF PDGEDAAPNE 
AGLQFYEEMF RELRRHHIEP LVTLSHYEMP LALSERYNGW VHRNVVDAFV RFSNVCFDRY 
KDLVRYWLTF NEIDSIHRHP FTTAGIREEK SAPGKAKQDI YQGLHHQFVA SALVTRDCHA 
KIPGSQVGCM LTKLTTYPHS CRPEDVEATL KKNLENYFYA DVQVFGEYPP LILRDLASRD 
IQIEMQADDQ RILKDHTVDF VSFSYYMSLT ESTQPDVERI PGNTILGVKN PYLPASEWGW 
QIDPVGLKIS LLELYDRYQK PLFIVENGLG AKDIVEDGKI HDSYRIDYFR AHFEQTLAAI 
NEGVDVMGFT TWGCIDIISA GTSQMSKRYG FIYVDQDDEG NGTLKRLKKD SFGWYQKVIA 
SNGADMS