Gene Ent638_1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1248
Symbol
ID	5114210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	1373777
End bp	1374925
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	56%
IMG OID	640491435
Product	galactokinase
Protein accession	YP_001175980
Protein GI	146310906
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.4259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCA AAGATAAAAC ACAATCCCTG TTTGCTGAAA CATTCGGCTA CCCTGCCACC 
CACGCAATTC AGGCGCCTGG CCGCGTGAAC CTGATTGGTG AGCACACCGA TTACAACGAC 
GGTTTTGTGC TGCCATGTGC GATCGATTAT CAAACTGTTA TCAGCTGTGC AAAACGCGAT 
GACCGTATCG TGCGCGTCAT TGCGGCAGAT TACGATAATC AAACCGACGA GTTTTCGCTC 
GACGAGCCGA TCGTGGCACA CGATACGCAG CAGTGGTCTA ACTACGTACG TGGCGTGGTG 
AAGCATCTGC AAATGCGTAA TAAGGGCTTT GGCGGCGCGG ACCTGGTGAT CGCCGGTAAC 
GTGCCGCAGG GCGCGGGGTT AAGCTCTTCT GCGTCTCTTG AAGTGGCCGT TGGGACGGTC 
TTCCAGCAGT TGTATCACCT GCCGCTGGAC GGCGCGCAAA TAGCCCTGAA TGGCCAGGAA 
GCTGAGAACC AGTTCGTGGG CTGCAACTGC GGCATCATGG ACCAGCTGAT CTCTGCTCTT 
GGTAAAAAAG AGCACGCGCT ACTGATCGAC TGCCGCTCGC TCGGCACCAA AGCGGTTCCC 
CTGCCAAAAG GCGCGGCGGT GGTGATCATC AACAGTAATT TCAAACGCAC GCTGGTGGGC 
AGCGAATACA ACACCCGCCG CGAGCAGTGC GAAACCGGGG CGCGTTTCTT CCAACAACCG 
GCGCTGCGTG ATGTCTCTCT AAACGAGTTC AATAAAGTGG CTCACGAGCT GGATCCCGTT 
GTGACCAAAC GCGTTCGCCA CGTGTTAACC GAAAATGCAC GCACCGTTGA AGCCGCGTCA 
GCACTGGCGC AGGGCGATTT GAAACGGATG GGCGAACTGA TGGCTGAATC GCACGCGTCA 
ATGCGCGACG ACTTCGAAAT CACTGTTCCG CAAATCGACA CGCTGGTGGA GATCGTCAAA 
GCGACTATCG GCGACAAAGG CGGCGTACGC ATGACCGGTG GCGGCTTCGG CGGTTGTGTT 
GTCGCCCTCA TCCCGGAAGA GTGGGTCCCT GCCGTTCAGG ACGCCGTTTC ACAGCAATAT 
GAAGCGAAAA CCGGAATCAA AGAAACCTTC TACGTCTGCA AACCTTCACA AGGAGCGGGT 
CAGTGCTAA

Protein sequence

MSLKDKTQSL FAETFGYPAT HAIQAPGRVN LIGEHTDYND GFVLPCAIDY QTVISCAKRD 
DRIVRVIAAD YDNQTDEFSL DEPIVAHDTQ QWSNYVRGVV KHLQMRNKGF GGADLVIAGN 
VPQGAGLSSS ASLEVAVGTV FQQLYHLPLD GAQIALNGQE AENQFVGCNC GIMDQLISAL 
GKKEHALLID CRSLGTKAVP LPKGAAVVII NSNFKRTLVG SEYNTRREQC ETGARFFQQP 
ALRDVSLNEF NKVAHELDPV VTKRVRHVLT ENARTVEAAS ALAQGDLKRM GELMAESHAS 
MRDDFEITVP QIDTLVEIVK ATIGDKGGVR MTGGGFGGCV VALIPEEWVP AVQDAVSQQY 
EAKTGIKETF YVCKPSQGAG QC