Gene PHATRDRAFT_49713 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49713
Symbol
ID	7198412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	-
Start bp	33040
End bp	34530
Gene Length	1491 bp
Protein Length	496 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002184556
Protein GI	219128724
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.379342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCTTA ACGACGTTTT TCAGTCATTC CGAAGTCTTC ATGGTGTGCA AAGCGAGTTC 
ACCACTTGCA ACATCGAAGA GTTTATTGTG CAAGGCGATC TGCTAAGGGA TTTTCCTGAA 
GTTTCGTTTG CCCAGTTTTC CAGTTTCCTG GAGCTGAACA ACGTTGTTTG GTTGACACCA 
GCTTGCTATG TGACCTCGGT TATTGTCCCA CACGAAGACT TATCGCGTGC CGAAGAGTCG 
GGCGATATTT ACGATGAATA CGCCAGAGTG GATGGCTCTC AAGATTGGGT GGGACAGATG 
CGAGGGATTG TCGTAAGATC GAAGCTTTTT CTACACGCAC AGACCGCTAC GGACATCCTG 
TTGTCTTTAC TAATACGGGA TCACTCCGAG TCTTTATTCT TTCGAGGTGC GGGTGCGTTT 
GCCACCTTTC CAGCCTCCAA TGGAGTATTT GAAGCACTTT TGATGAACAC AAATTGCAAG 
ACAGCCCCGG CTGTGACACT ATCGAACATG ATGCTGACAC CCGAACAATG TCAAATATTG 
GCTCGCTCCA AGCTTTCCCG CCTACATGTG TTGGAAAATG TAGAATGCGA GGACCGGGGA 
GACGGCTTTG CGGAACAGCT AGTGGCTTCG CATATTGGTG CAGCTGCTCC GAGTGAAAAG 
GTATCAATAC CGCACAGCAC CCTCTCGCAC TTGACGCTCG CGTGTGAAAA ACTTTCAGAG 
GAAACGTTAG AGATAATTAT AGAGTCGTTC GGTCGGGCAG TTTCCTTGCG TTATCTGACT 
CTTTCGGGAG ACTTCCGATT TTCTAAGCGG AAAAGCATGG CCATAGTAGC GCTTTTTTCG 
GAGACAAATC TCACAAATGT CGATATTTCC AATGCACTCC TACCCTCCGA AGCTTTCGGC 
GTACTTTTTC AGCTCCCCAA CCTGCTGGAG CTTGCCGTTT GCTGTCAAGG CCTTCCGCCT 
TGTTTTACCG AAGGCATTTT GTTGAACAGA TCAATTCACG TTCTCGATTT ATACCGGGAT 
CCTAGAGCTG TCCAACTACC TCTAACCAAC GAATCAATGG ATCGATTCTT TGCTTCCATT 
CGACACCATC CACAGCTCTA TCAACTTACT TTCGACTCTC TCTACGTCGA TGAAAACCGC 
CCCGACTATC CTACACGAAG ACATCACACT GAATCTCTTC AGAGCATGTT CAAGACAAAC 
CGTACAATCC GGAAATTGCG TTTGGCGGCA TCCGAATGGG ATGAAACATT ACTCTCGACC 
ATACAGGAGC AAGTGCACGT CAACAAATAC AGACCTCGTT CGCAGGCCCT TTTAATGGAG 
GCTGCAGTGG ATCGTCGGGC TTTGCTGGGA CATGCATTGG TCGCGGTGAA TCACAAACGC 
TATGCTTCTG ATCGGACCTT TCTAATTTTG TCCCAAAATG TAGACGTTTT TAGTATTAAA 
CACGGACGTA GACATAGCAA TCTTGTCGCG AAGCGGAAGC GATTTCAGTA A

Protein sequence

MDLNDVFQSF RSLHGVQSEF TTCNIEEFIV QGDLLRDFPE VSFAQFSSFL ELNNVVWLTP 
ACYVTSVIVP HEDLSRAEES GDIYDEYARV DGSQDWVGQM RGIVVRSKLF LHAQTATDIL 
LSLLIRDHSE SLFFRGAGAF ATFPASNGVF EALLMNTNCK TAPAVTLSNM MLTPEQCQIL 
ARSKLSRLHV LENVECEDRG DGFAEQLVAS HIGAAAPSEK VSIPHSTLSH LTLACEKLSE 
ETLEIIIESF GRAVSLRYLT LSGDFRFSKR KSMAIVALFS ETNLTNVDIS NALLPSEAFG 
VLFQLPNLLE LAVCCQGLPP CFTEGILLNR SIHVLDLYRD PRAVQLPLTN ESMDRFFASI 
RHHPQLYQLT FDSLYVDENR PDYPTRRHHT ESLQSMFKTN RTIRKLRLAA SEWDETLLST 
IQEQVHVNKY RPRSQALLME AAVDRRALLG HALVAVNHKR YASDRTFLIL SQNVDVFSIK 
HGRRHSNLVA KRKRFQ