Gene Phep_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_0114
Symbol
ID	8251199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	136250
End bp	137350
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	46%
IMG OID	644933764
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_003090402
Protein GI	255530030
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0534581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAA TCACCAATTG TAAGCTCTTC AAAGAGGGGC TGCTGTCAGC AGACCAGCAT 
GTACTTATAG AAAATGGAAA AATCACAAAA ATTTCCAATG AAACCATTCC AGATGGGTTT 
GAGCGTATAG ATGCCAGGGG TGATTACCTT TGTCCTTCTT TTATAGACCT GCAGATCTAT 
GGCAGTGGAG GCCAGCTTTT TTCGGCCTAT CCGACAGCAG ATACCTTAAA ACAAATGGAC 
GCAGACCTGA TTGGAAAAGG CACTACTGGT TTCCTGGCCT GTGTGGCCAC CAATAGCATG 
GAAATCGTTT ACCAGAGTAT TGATGCAGCC AAAGCTTATC GTGCGGAAGC CCGGGGTTTT 
TTAGGCCTGC ACCTGGAAGG ACCATATCTG AATCCTAAAC GCAGGGGCGC ACATATAGCA 
GCTTATATCC ATAAAGCCAG TTTAGATGAG GTGAAACGTT TGCTGGACCA TGCTGATGGC 
ACGGTAAAGA TGATGACCCT CGCTGCAGAA CTTCAGGACG AGGCGGTGAT CAGCTGTTTA 
CTGGAACATG GTGTGCTTTT ATCACTTGGA CACAGTGATG CCAGCTTTGC TGAAGCTACT 
GCTGCTTATA ACAATGGATT TAAGACTACT ACGCATTTGT TTAATGCCAT GCCGCCCATA 
CATCACCGGA CGCCAAATTT ACCTGTTGCT GTATTTAACC ACCCCAGTGC AATGGCCAGT 
ATCATAGCGG ATGGCAACCA TGTGGATTTT GAGGTAGTAA AAATGAGCCA TAAACTGATG 
GGCGACCGCT TATTTTTAAT TACAGATGCG GTAACGGAAT GCGATACCGG TCCTTATCAG 
CATCAGCTGT CCGGCGAAAA ATTTATTACA GCAGATGGCA CGCTTTCTGG CTCTAATATC 
ACCCTGGTCC AGGCAGTACA AAATTGTGTA AAATATTGCG AAATTCCGTT GTATGACGCG 
ATAAACAAGG CTTCAGCATT GCCTGCGGGT TTAATGGGAC TGTCTGATGA AATCGGTTCT 
TTGAGCGTGG GCAGCAGGGC TAACCTGCTG CTGCTGAATG CTGAACTTCA GCTCCGTAAA 
GTTTTTGTGG ACGGTTTGTA G

Protein sequence

MIAITNCKLF KEGLLSADQH VLIENGKITK ISNETIPDGF ERIDARGDYL CPSFIDLQIY 
GSGGQLFSAY PTADTLKQMD ADLIGKGTTG FLACVATNSM EIVYQSIDAA KAYRAEARGF 
LGLHLEGPYL NPKRRGAHIA AYIHKASLDE VKRLLDHADG TVKMMTLAAE LQDEAVISCL 
LEHGVLLSLG HSDASFAEAT AAYNNGFKTT THLFNAMPPI HHRTPNLPVA VFNHPSAMAS 
IIADGNHVDF EVVKMSHKLM GDRLFLITDA VTECDTGPYQ HQLSGEKFIT ADGTLSGSNI 
TLVQAVQNCV KYCEIPLYDA INKASALPAG LMGLSDEIGS LSVGSRANLL LLNAELQLRK 
VFVDGL