Gene PHATR_44040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_44040
Symbol
ID	7204226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011671
Strand	+
Start bp	772880
End bp	775318
Gene Length	2439 bp
Protein Length	812 aa
Translation table
GC content	59%
IMG OID
Product	UDP-N-acetylglucosamine--peptide N-acetylglucosaminyltransferase
Protein accession	XP_002186126
Protein GI	219113085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.69787
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTG ACGCTCCACG CTCCCGTCCA CGTCGGCCGT TCCGACGTTG GCTGGTCCTC 
GGTGTGACCA TCCTTTCCTA CTCCGGGATG TTCGTGCGAG CGCAACAACA ATCACCGCAA 
CAATCGCTGT CCGGCGACGT CCTCCGGGAC GGACCGGCGT ACTGGCAACG CGGTCGGGAT 
CATTTCCGGG ACGGCCGCTA CGACGACGCC GCCACTGATT TGTGGAAGGC CGTACTCTTG 
CACACGCAGA CACCACCCGC ACAAACGTAC GATGTACAGG ACGTCTTTCG GTTGTTCCTG 
CAGTGCTACG TGGTGCGGGA CCGGGCCGCC GACGGATTGG CTTTCGTGGC GGGAGAATCC 
TTCCGCCGGG GACAGGACGA CATGGGACGA CTCTACCTGC AACAGGCACT CGGCATGGAC 
CCACGCAACG ATGCGGCGTT GCTCGTCCAA GCCGAATTCG GCGACGCCGT GGACCAGTCG 
TTGTCGGCGT CGACAACGGC ACCCACGTCG CACGACAACC CCTTTCCGGG ACAAACGCCG 
GAACAACTCT ACGAAGTCGC CAGTCGCCAA TTTTCCGACA AGAACTACGA AGCCTGTGCC 
GACGTATTCG AACTGTCCTG CCAGCAATCG GGACGGAAAA TCGGACCCTC CTGTGCCAAC 
GCCGTATACT GTCGAAACAT GTTGACGGAT TGGGGATTCA ACGGCACACA GTTTGACCGG 
GACATGCAGA CCATTGCGAC GCTCGTCCGA ACCGAAACGG CGCAGTACCG ATTCCGACAC 
GAAACCGACG CGAACCAGTT CGTGTGGCAG CGGGCGACGT CGCCCCATCC CCACATGATG 
CTCGGTTACC CGGTAGATCC CTTGCTCAAG CGCTACGTCG CCGAGTCCGC GGCCTACTTG 
GACGAACAAA TGGCACGCCT CGCCCACACC GCACCCACCG AGACCGCGTT GCCCTCTCTC 
CCGCCGGGAC TACCCTACCA CGTCCACGAC GATCGCCAAC GGTTTGCTGA CGAACGCGCG 
GCGGATCCTC ACGCCAAAAT ACGTGTCGGC TTTGTCGGAT CCGGCTTCAA CTCGAAAGCC 
GTCCTCTATC TGTCCCAAGA TATGTTTCGA TTCTTCGGTC GCGAGTTCGA AATTCACGTC 
TTTTCCTTTG GTCCACGGGA CCATCCCATG TTCATTGAGC GCGGCATGCG TGGCGTCGAT 
TGGCGAGAGC GTGTCAAGTC CAACGTTCAC TTCTTTCACG ATTGCCAAGC CATGAAGCTG 
GATCACATCA AAGCCGCACG CTTCATTCAC GACCAGAATA TACACATACT CATCGAATGG 
GACGGATACG CACGTCAGGG CGAACGAGCG CAAGGTCTCT TTGCTCTACG ACCAGCCCCG 
ATTCAGATCC TCCATCAAGA ATACCTGGGC ACCAGTGGGG CGCTCTACGT GGACTACCTC 
TTTACCGATC AAGTGTCGTC ACCGCCATCC CTACAGCACC TGTACACGGA AAAACTCATC 
TATTTGCCGA ACCATTTCTT CAGCAAAGGC CACGCCTACC AAAAGGAAGT CCGCGAGCCA 
CGGTACGAAT ACCAACCCGT GACTCGTCCC CATCAGTTGG GGACGGGCTC TCCCCAAGAA 
AATCGCTGTC TCGCTCCGCC CGACGTGGGA CCCACCGACG TTGCGTTTGT CTATTGCAAC 
TTCAACAAAT TTCTCAAAAA CAACCCCGAA ACGGTCCGCG GCTGGATACA AATTCTACGG 
CAGGTCCCCG ATTCGATCCT GTGCCTTCTG GACAACCCCC GCGACGGTAT CCCCTACCTC 
CACAAATTCA TTCACGAAGC CGCCGGCACT TCCGACGGAA ATTCCCCGGA TTCCTTCCAA 
CCGGGCGACG GGGACGACTT GGTAAACCGC GTACACTTTC TCCCCTGGGA GCCCAATCCC 
TTCGATCACC AGCAGCGGAA TCGCGATTTC TGCAACGCCA TGTTGGATTC ACACCCCTAC 
AACGGCCACA CGGTGGCGCA GGATGCCCTG TACGCGGGTG TCCCGATCGT AACCCGCAGC 
GACGGCGACG ACATGAGTGC GCGGGTCACG ACGTCCGCCA ATCTGGTCCT GGGCTTGTCG 
CATTTGAACG CCGTACACGG TCCGGCGCAG TACGTGGCGA TTGCCGTGGC GTTGGGGACC 
AACGCCACGC TGTTTCGGGA AACCCGGGAG CGGTTGATCG GTACGGCACT CCAGCGGAAT 
CCCATGCACC CGTACTGGGA TGTGGCTCGG TACGTACTGA ACTTTGAAAG CGGGTTGCGC 
GTGGTTTGGG AACGTTTTCT TCGAGGCCAA GCGCCGGATC ACGTGGTCGT GGAGGAAACG 
GCGGACGCCG CGCGGGGTAC GTACGACGAC AAGATTCGGG CGCATCCACC GCAAGGCAAC 
CGGGCACGCC GTGAGCGGGC AGCGAACGAT GAACTGTAG

Protein sequence

MTIDAPRSRP RRPFRRWLVL GVTILSYSGM FVRAQQQSPQ QSLSGDVLRD GPAYWQRGRD 
HFRDGRYDDA ATDLWKAVLL HTQTPPAQTY DVQDVFRLFL QCYVVRDRAA DGLAFVAGES 
FRRGQDDMGR LYLQQALGMD PRNDAALLVQ AEFGDAVDQS LSASTTAPTS HDNPFPGQTP 
EQLYEVASRQ FSDKNYEACA DVFELSCQQS GRKIGPSCAN AVYCRNMLTD WGFNGTQFDR 
DMQTIATLVR TETAQYRFRH ETDANQFVWQ RATSPHPHMM LGYPVDPLLK RYVAESAAYL 
DEQMARLAHT APTETALPSL PPGLPYHVHD DRQRFADERA ADPHAKIRVG FVGSGFNSKA 
VLYLSQDMFR FFGREFEIHV FSFGPRDHPM FIERGMRGVD WRERVKSNVH FFHDCQAMKL 
DHIKAARFIH DQNIHILIEW DGYARQGERA QGLFALRPAP IQILHQEYLG TSGALYVDYL 
FTDQVSSPPS LQHLYTEKLI YLPNHFFSKG HAYQKEVREP RYEYQPVTRP HQLGTGSPQE 
NRCLAPPDVG PTDVAFVYCN FNKFLKNNPE TVRGWIQILR QVPDSILCLL DNPRDGIPYL 
HKFIHEAAGT SDGNSPDSFQ PGDGDDLVNR VHFLPWEPNP FDHQQRNRDF CNAMLDSHPY 
NGHTVAQDAL YAGVPIVTRS DGDDMSARVT TSANLVLGLS HLNAVHGPAQ YVAIAVALGT 
NATLFRETRE RLIGTALQRN PMHPYWDVAR YVLNFESGLR VVWERFLRGQ APDHVVVEET 
ADAARGTYDD KIRAHPPQGN RARRERAAND EL