Gene Ent638_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1249
Symbol
ID	5114211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	1374929
End bp	1375975
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	56%
IMG OID	640491436
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_001175981
Protein GI	146310907
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.398419
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAT TCAATCCCGT CGATCATCCG CATCGGCGTT TTAACCCGTT AACCGGCCAG 
TGGATTTTGG TTTCGCCACA TCGCGCTAAG CGTCCGTGGC AAGGGGCGCA AGAAACGCCG 
GCGAAACAGA CGTTGCCACA GCACGATCCG GATTGTTTCT TATGTCCGGG CAATACCCGC 
GTCACGGGCG ATAAAAACCC CGATTATCAA AGCACTTACG TTTTCACTAA CGATTTTGCT 
GCGCTGATGA CCGACACACC GGACGCGCCG GAAAGTGCGG ATCCGCTGAT GCGCTGTGAA 
AGCGCACGCG GCACCAGCCG GGTGATTTGT TTCTCGCCCG ATCACAGCAA AACGCTGCCG 
GAACTGAGCG TCAATGCGCT GACCGACGTG ATCAAAACCT GGCAAGATCA GACCGCTGAG 
CTTGGCCAGT CCTATCCCTG GGTGCAGGTG TTTGAGAATA AAGGTGCGGC GATGGGCTGT 
TCTAACCCAC ATCCGCACGG CCAGGTATGG GCGAACAGTT TTCTGCCGAA CGAAGTTGAG 
CGCGAAGACC GCCTGCAAAA AGACTATTTC ACCGAAAATC ACTCCGTGCT GCTGGCCGAT 
TACGTGCAGC GTGAAATGAC CGACGGTAGC CGTACGGTTG TCGAGACTGA ACACTGGCTC 
GCTGTGGTGC CGTACTGGGC AGCGTGGCCG TTCGAGACGC TGCTGCTGCC AAAAGCACAC 
GTTCTGCGCC TTACCGATCT GACGGAAGAG CAGCGCGATG ATTTGGCGCT AGCGCTGAAA 
AAACTGACCA GCCGCTACGA CAATCTTTTC CAGTGCTCTT TCCCGTATTC GATGGGCTGG 
CACGGCGCGC CGTTTAATGG TGAAGATAAT CAGCACTGGC AATTGCACGC CCATTTCTAC 
CCGCCGCTGC TGCGCTCAGC CACGGTACGT AAATTTATGG TCGGCTACGA GATGCTGGCA 
GAAACCCAGC GTGATTTGAC GGCAGAACAA GCAGCTGAAC GTCTGCGTGC CGTTAGCGAT 
GTGCATTACC GCGAATCAGG AGTCTAA

Protein sequence

MTQFNPVDHP HRRFNPLTGQ WILVSPHRAK RPWQGAQETP AKQTLPQHDP DCFLCPGNTR 
VTGDKNPDYQ STYVFTNDFA ALMTDTPDAP ESADPLMRCE SARGTSRVIC FSPDHSKTLP 
ELSVNALTDV IKTWQDQTAE LGQSYPWVQV FENKGAAMGC SNPHPHGQVW ANSFLPNEVE 
REDRLQKDYF TENHSVLLAD YVQREMTDGS RTVVETEHWL AVVPYWAAWP FETLLLPKAH 
VLRLTDLTEE QRDDLALALK KLTSRYDNLF QCSFPYSMGW HGAPFNGEDN QHWQLHAHFY 
PPLLRSATVR KFMVGYEMLA ETQRDLTAEQ AAERLRAVSD VHYRESGV