Gene PHATRDRAFT_54703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_54703
Symbol
ID	7201966
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	756815
End bp	758253
Gene Length	1439 bp
Protein Length	472 aa
Translation table
GC content	50%
IMG OID
Product	udp-n-acetylglucosamine pyrophosphorylase
Protein accession	XP_002181257
Protein GI	219121821
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.860159
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAAA CCCGCAACGT GTTCACAGAC GCAGATGACG AATCGGAAAT TCGGTCTCGC 
TACGTGCAGG CCGGTCAGGA GCATGTGTTC CAACACTACG CCCAATTGTC GCCGACGGAA 
AGGACATCTT TTCTGCATCA GCTGCGGGAC ATTCAGGTTG AAAACGTTGC CATTTTATTG 
AAGTCAGCCG AATCTATCGA CCAAGGAGAG CCCACCGACG AGACAGCTAT TGCGCCTTTT 
CCTACCAATA TTGTTGGTAG ATCTACTGAT GAGACGCTTG TGCGAGATTC CTACACAACG 
GGCATGGAAG CCATTCGAAA GAATCAAGTA GCTACCCTAG TATTAGCCGG AGGTCAAGGA 
ACTAGATTGG GATTTGACGG TCCCAAGGGC ATGTACAGTA TTGGCCTACC GAGCGAACGG 
ACACTCTTTG CCATGATGGC GCTGAGGATC CGAAAACTTG CGGCACTAGC CGGTGAGGAA 
AATGTTGCTT TACCGTTTTA TGTCATGACC TCGCCCCTCA ATCACGACGC GACAGTGGCA 
TACTTCCATT CCAAAGAGTA TTTTGGGCTG CCGGAGAGTG ACGTGTTTTT CTTTCAGCAG 
GGAACTCTTC CCTGCCTGAC GAAAGACGGT AAGATTATTC TCGAACGAGC AGGGAAAGTA 
GCCGTCGCTC CCGACGGCAA CGGTGGTATA TACCCTGCCT TGCAGCGCTC CGGTGCGCTG 
CAAGATATGA TGACCAGGGG TGTCCGATAT CTTCACGTAT TTAGCATTGA CAATGCCTTG 
ATCAAACCAG CAGATCCGGT CTTTCTCGGA TACTGCATCG GACAAGGAGC CGACTGTGGC 
AACAAGGTTG TGTGGAAGTC GCACGCACAT GAAAAAGTTG GAGTTGTGGC GTCTCGAGGC 
GGGAAGCCTT GTATCGTGGA ATATTCCGAA ATCACAACAG AAATGGCGGA GAGCACGGAT 
GATGACGGGC GATTGCTGTT TGGAGCGGGC AACATCTGCA ATCACTTTTA TACTTTAGAC 
TTTCTGAGAG AGAAGATTCT ACCCAACATG GGCAACATGT ATCACATTGC GCACAAGAAG 
ATTCCCTTTT ATGACGCAGC TACTCAATCC ACAGTTGCCC CGACCGAAAA TAACGGCATC 
AAGCTGGAGA CTTTTATTTT TGACGTCTTT CCCCTTTCCG TGAATATGGC CGTTTTTGAA 
ATTGAACGAA GCGAAGAATT TTCGCCCGTC AAGAATAAGG CAGGGTCGGA AGCGGACAGT 
CCAGATACGG CTCGAGCCAT GGCTTCCGAT CAGGCTAAAA AATGGATCAA AAATGCTGGT 
GGTAACTTGA TCGGAAAGGT GGATGATGGT GTTTGCGAGA TTTCACCACT CACTTCCTAT 
GGCGGAGAAG GATTGGAGCA CTATGAAGGT CAGGATGTTG CCTGTCCGTT TAGCCTATG

Protein sequence

MDQTRNVFTD ADDESEIRSR YVQAGQEHVF QHYAQLSPTE RTSFLHQLRD IQVENVAILL 
KSAESIDQGE PTDETAIAPF PTNIVGRSTD ETLVRDSYTT GMEAIRKNQV ATLVLAGGQG 
TRLGFDGPKG MYSIGLPSER TLFAMMALRI RKLAALAGEE NVALPFYVMT SPLNHDATVA 
YFHSKEYFGL PESDVFFFQQ GTLPCLTKDG KIILERAGKV AVAPDGNGGI YPALQRSGAL 
QDMMTRGVRY LHVFSIDNAL IKPADPVFLG YCIGQGADCG NKVVWKSHAH EKVGVVASRG 
GKPCIVEYSE ITTEMAESTD DDGRLLFGAG NICNHFYTLD FLREKILPNM GNMYHIAHKK 
IPFYDAATQS TVAPTENNGI KLETFIFDVF PLSVNMAVFE IERSEEFSPV KNKAGSEADS 
PDTARAMASD QAKKWIKNAG GNLIGKISPL TSYGGEGLEH YEGQDVACPF SL