Gene Phep_1567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1567
Symbol
ID	8252669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	1850599
End bp	1851774
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	43%
IMG OID	644935221
Product	hypothetical protein
Protein accession	YP_003091842
Protein GI	255531470
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.405342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.475535
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATCA ATTTATTTGA TGATAATGCC TGGTTATCCC TGCGTCCATT ATCTTTTACC 
AGACCAGTTG CAGATCTTCG TGTAGGAATC CTCACGATTG CTGAAAAGTG GAAGAAACAT 
CTGAATGTAG CATCTGGCTT CATTACCGCC GAACACCTGG CCGTTAAATA TCCTCCGCTT 
AATGGAGTCC AGCTCTATAT CAATGGCTCA ATTTGTCCTG ATGAGGCACT GCTGGAAGCG 
ATCTCAGCAC TGCAAACCGG TGAGGCCTTA AAAAAAGAGG GTATTTTAAT TGCCTGTAAA 
ATTGATGCCG GTACAGCTTT TATACCTGAT ATCGACGCGC AGTTGGAAAT CAAAATATAT 
CAGGGAAAAT TTATCAGGAT CTCTTTACCC GAAGATATAT TCAGGAATAA TGATGCTGAA 
CTGAAAAAAG ACTTTGCTTT ACTGACCCAG GGGCGGGCTT CAGCTAAACT GAGCAGTACA 
AATGTTTTTT TAGGTGATGA ATTTTTTGCA GAAGAGGGGG CACAAGCCGA ATGTTCTACT 
TTTAACAGCC TGAACGGGCC CATTTATATA GGAGAGAATT CGCAAGTGTG GGAAGGCTGT 
CACATTCGCG GATCTTTTGC ACTTTGCAAC AATTCGCAGG TAAAAATGGG AGCTAAAATC 
TACGGACAAA CTACCATAGG CCCCTATAGT CGGGTAGGTG GCGAAATTAA CAATGCCATC 
ATCTGGGGCT ATTCTTCCAA AGGACATGAA GGCTACCTGG GTAATGCTGT ACTGGGGCAA 
TGGTGTAACA TTGGTGCCGA CAGTAACAAT TCTAACTTAA AGAACAACTA TGCTGAGGTT 
AGGTTATGGG AGTATGCAAC AGAAAGTTTC CGTAATACCG GTTTACAATT TTGCGGACTG 
ATCATGGCCG ATCATGCCAA ATGCGGCATC AATACGATGT TTAATACCGG AACAGTTGCC 
GGTGTGAGTG CCAATATCTT TGGCTCCGGC TTTCCCAGAA ACTTTATTCC CGATTTCGCC 
TGGGGTGGGG CACATGGATT TGATGTGTAT AGCCTGAATA AAATGTTTGA AACATCAGAG 
AAAGTATACG AACGTAGAGA TATCTCGTTT GACCAGACAG AGCAGGATAT TTTATCTGCT 
GTTTTTGAAA TGACCAAAAG CTACAGGCAC TTTTAA

Protein sequence

MMINLFDDNA WLSLRPLSFT RPVADLRVGI LTIAEKWKKH LNVASGFITA EHLAVKYPPL 
NGVQLYINGS ICPDEALLEA ISALQTGEAL KKEGILIACK IDAGTAFIPD IDAQLEIKIY 
QGKFIRISLP EDIFRNNDAE LKKDFALLTQ GRASAKLSST NVFLGDEFFA EEGAQAECST 
FNSLNGPIYI GENSQVWEGC HIRGSFALCN NSQVKMGAKI YGQTTIGPYS RVGGEINNAI 
IWGYSSKGHE GYLGNAVLGQ WCNIGADSNN SNLKNNYAEV RLWEYATESF RNTGLQFCGL 
IMADHAKCGI NTMFNTGTVA GVSANIFGSG FPRNFIPDFA WGGAHGFDVY SLNKMFETSE 
KVYERRDISF DQTEQDILSA VFEMTKSYRH F