Gene Sde_1097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_1097
Symbol
ID	3968261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	1407158
End bp	1408315
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	48%
IMG OID	637920165
Product	galactokinase
Protein accession	YP_526571
Protein GI	90020744
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0010459
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.419761
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACAA TAATTCAAGA CGTTGCCGCT CTATTTGAAA CGCATTTTAA CGCTCTCCAC 
GAAGTACTCT TCCACGCGCC TGGGCGCGTA AACTTAATTG GGGAACACAC AGACTACAAC 
AACGGCTTTG TGCTGCCATG CGCAATCGAC AGGGGCACGT ACCTTGCGAT TAAAACACGC 
GAAGACAACT TGATTCGCGT TGTTGCAGGC AACTTAAGCA ATGCCGCGAG CGAATGGCCA 
GCATCATTGC CAGTTGAGCA CGACAAAAAT AACGCATGGG CCGATTATAT TCGCGGCGTA 
ACAGAGCAAC TACTGAAACA AGGTCACACA CTAAAAGGTA TGGACATTGC CGTACTGGGG 
AATGTCCCTC AGGGAGCAGG CCTTAGTTCG TCTGCCTCTT TTTCTGTGGG ATTCGCCACG 
GCGTGCAACG CTATTAATAC ACTGGGACTT TCGCCAACTG AAGTAGCGCT ATGCTGCCAA 
GCGGCCGAGA ACGAATTTGC AGGATGCAAT TGCGGCATTA TGGATCAACT TATTTCCGCT 
GCCGGCGAAG CAGGACACGC GTTGCTAATA AATTGCGGCG ATTACAGCTA TGAGCCTTAC 
GCAATTCCTG AAGACCTAGC TATTATGATC ATAGACAGCA AAGTTAAGCG CGGTTTAGTA 
GATAGCGAAT ACAACACTCG ACGCAAACAA TGTGAAGAAG CCGCATTGAT TATGGGCGTA 
AGTAGTTTGC GCGATGCCAC CCTTTCTTTG CTAGCGGAAA GCAAAAACAA AATGACGGAC 
GAGGTTTTTC GCCGCGCGAA ACATGTAATA ACAGAAAATC AACGCACCAT TGACGCAGCG 
GAAGCGCTAG CCAACAAGAA CTACACATTG TTAAATAAAC TAATGGCCGA ATCACATATA 
TCCATGCGCG ATGACTTTGA GGTAACCACC TCGCAAATAG ACTTACTTGT TGACTTAGTT 
GGCGAGCACT TGGATAACGA CGGCGGTGTG AGGATGACCG GCGGAGGGTT TGGTGGGTGT 
GTGGTGGCTT TGGTGCCCAA AGTAAAAGCA GAAGCAATCT CCAACGCAAT ACTTAAACCA 
TATAAAGAAG CGACAAATTT AGACGCAGAG ACCCATATTT GTTTAGCGTC TGCGGGAGCA 
GCTAGCCTAA ACACCTAA

Protein sequence

MKTIIQDVAA LFETHFNALH EVLFHAPGRV NLIGEHTDYN NGFVLPCAID RGTYLAIKTR 
EDNLIRVVAG NLSNAASEWP ASLPVEHDKN NAWADYIRGV TEQLLKQGHT LKGMDIAVLG 
NVPQGAGLSS SASFSVGFAT ACNAINTLGL SPTEVALCCQ AAENEFAGCN CGIMDQLISA 
AGEAGHALLI NCGDYSYEPY AIPEDLAIMI IDSKVKRGLV DSEYNTRRKQ CEEAALIMGV 
SSLRDATLSL LAESKNKMTD EVFRRAKHVI TENQRTIDAA EALANKNYTL LNKLMAESHI 
SMRDDFEVTT SQIDLLVDLV GEHLDNDGGV RMTGGGFGGC VVALVPKVKA EAISNAILKP 
YKEATNLDAE THICLASAGA ASLNT