Gene Phep_2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2134
Symbol
ID	8253240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2458823
End bp	2459974
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	42%
IMG OID	644935783
Product	galactokinase
Protein accession	YP_003092400
Protein GI	255532028
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.856123
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0763102
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCG AAATGATCAG TGAATTCCTG GAAAAATATG GACATGAGCC AAAACAAAAC 
TACTTTACCC CCGGTCGTGT AAACCTTATT GGAGAACATA TTGATTATAA CGGAGGCCTG 
GTTATGCCCT GTGCCGTTAC TTTAGGAACC TGGCTGAGCA TAGCACCCAA CAACGATAAG 
GTGATCAGAT TTAAAAGCCT GAACTTTCCA GAAGAACGCG AATTTGATCT TCAGCCTTCT 
TACACCAAAA CAGGCCCCGA ATGGTACAAT TATCCTTTGG GTGTGTTCCA TGAAATCTTA 
AAAAAACATC AGATCCCAAC AGGTTTGGAT CTCTTGTTTC ATGGGAATAT CCCGATTGGC 
TCAGGCCTAT CTTCCTCAGC CTCTATTGAA GTGGCTATGG CTTATGCTTT AAATGATTAT 
TTTAACCTGG GTTACGAAAA AATTGAAATC CCCTTGCTTG CCCAAAAGGT AGAGAATGAA 
TTTATTGGTG TAAACTGTGG CATTATGGAC CAGTTTGCTG TTGCTTTTGG TGAAACCGAT 
AAAGCCATAG TATTAAACTG TGATACACTA AAATATAAGA TCGTTGATTG CAGCCTGGGC 
GATTACTCAC TGGCTATTAT CAATACCAAT AAACCCCGTA AACTGGCAGA GTCCAAATAC 
AATGAGCGTG TAGCCGAATG TCAAACCGCT TTAAAACAAT TGAACCAGGA AATTACCCTG 
CATAACCTGT GCGAGCTGAA TGCCGACAAA TTTGCTTTGC ACAGTCACCT TATTACCGAC 
CCTACCGTAC TAAAAAGGGC AACACACGTA ATCAGAGAGA ACGACAGGGT TAATCTGGCT 
GCAAAAGCTT TAAATGAAGG CAACCTGACA GAATTTGGCC GCCTGATGTA TGCTTCTCAC 
CAATCCTTAA AAGAGCTGTA TGAAGTAACG GGTGCAGAAC TGGATGCTGT AGTCGAATTC 
TGCTCAGCTT ATGCACACGT AATTGGAGCA CGGATGACCG GTGCAGGTTT TGGTGGTTGT 
GCCATCGCCT TATTAAAAAA AGGCAGGGAA GAAGATTTTG CTAAAAAGCT TAACGATTTC 
TATGTGGCAC GTATTGGTTA CCCTGCTGCC ATCTATATCA GTGAAATTGG CAATGGTGCT 
TCCGCAATTT AA

Protein sequence

MKTEMISEFL EKYGHEPKQN YFTPGRVNLI GEHIDYNGGL VMPCAVTLGT WLSIAPNNDK 
VIRFKSLNFP EEREFDLQPS YTKTGPEWYN YPLGVFHEIL KKHQIPTGLD LLFHGNIPIG 
SGLSSSASIE VAMAYALNDY FNLGYEKIEI PLLAQKVENE FIGVNCGIMD QFAVAFGETD 
KAIVLNCDTL KYKIVDCSLG DYSLAIINTN KPRKLAESKY NERVAECQTA LKQLNQEITL 
HNLCELNADK FALHSHLITD PTVLKRATHV IRENDRVNLA AKALNEGNLT EFGRLMYASH 
QSLKELYEVT GAELDAVVEF CSAYAHVIGA RMTGAGFGGC AIALLKKGRE EDFAKKLNDF 
YVARIGYPAA IYISEIGNGA SAI