Gene PHATRDRAFT_44453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_44453
Symbol
ID	7197745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	+
Start bp	610416
End bp	612342
Gene Length	1927 bp
Protein Length	589 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002178263
Protein GI	219114935
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCCCCAAAAT CTGCATGTGA TTCGGTTAGT AGTTCATCTC ATACCAAAAT TTTCTCTTCG 
ATTCGTGTTG CCTCGCTTTA GCTGTGGAAA GGCTTGTTCC GGGAGCACGA AGAGAGAAAC 
ATTCAATATC GGATAATTTT CCGGTCTCGA GGGTGCAATG AAACAATCCC GCTCGTCCAG 
ATCTCGCGTG GAAAAAACTG TTCCAAAACC ACCGCCTACT GGCCCAAAAA CTCCATCTAC 
GCTGGCCGCC ACCGTGGCAG CAGGGAAATC TTTCGAGACC ACCGAGCGCT GCGGCACATG 
TTCTGCATGT TTACGTGAAG ACTGTGGCCA GTGCGAAGGA TGCGTATGCA AACAAAAATA 
CGGAGGTGAT GGCTCCAGTA AGAAGCAGTG CGTCTATCGG GGTTGCCAAG CTATTTCGGA 
GATAAATCTA AAGGTCGGCG GTGGCTGCTT CGCGAGCGCC ACTCACAACA GCGACATCAG 
TAGCGTTTTG TCTATATCGC AATACCCACC ATACCCCTTC ACACCGCCAC CGTCTTTAAT 
CGACGTCAAC AAAAAGAGGA AACCTGATTT GACAATAGCT GACAAAAAGT CGATGTATGG 
GAAGCTCATC CCAAGTGAAT CTCCACGCGA TCACTGTTCC GGCTGCAACT TACGGCAAGA 
AACCATTAAC GATTCTGTGC TTATCTGTGA CGGTCCTGCT TGCGGTCGTG AATATCATCT 
GCGTTGTTGC GTGCCTGCTC TTGACATCAT TCCGGAAGGC GATTGGCTCT GCCAAGACTG 
CAGTCCGTCT GGCAGCGCTG AAACTTTGAT GCAATATCTT GAATCAAACG ATGAACGACG 
TTGTGACTTT CAATCTTCTG AGGAATTTGT TGCCTCTCTC ATCTCACATG ACATGGTAAA 
AGAAAAAGTG CACCGTCGCC CTCTGTCGGA ACTCGAACGA GCCACTGAAA TCCATCGTAG 
TGCAATTGGC GAAAATTGGA ACCTTTTGAT TTCACCAGAC TTTTATGTCG GAAAGCCGTT 
GCGTATTTAC GATGGACTAG CAAACCAGTA CCATTCGGGC CGTCTGGTAG ATTGTCGACA 
GTCTCTCTCT TGTGGGACAG TAGAATACCT TGCGCGTTTC CCTTCCGGAA AGGATGGTCG 
GAAATCTCCA CTCCACCACT GGATTATTCT CGAAGAACAT TGCCTTGCTA TTGGCACCGC 
ACTGATCTGG TCACAAACTC TTGGTCGGCG TTGGAAACCT GCACAGCTCC TGCTTCGTAC 
TGGAAGAGAA CTTGTCTCTG TCGCCAGTAT GTATTCGGAA GAACAAGGTG AGATTCGGTT 
TACGGATTCC AAGCATACTT TGAATGCGTT GCCTAGCACA CCGGAAACAG ACACAACTAA 
ACCTGCGGCC ACTCCATGCT CGGGAAGTGC CTCTCGATCA GCACCGTCTG AGCCAAGGTT 
TCCTATCAAG AAGAGGCGAA GGAACGAAGT GTGGGGCCTT GTACGTTTCT TTGGGGAAGG 
AACCTTTGAA TTCGTCCCTT TGACAGCTCG TGCTCGCAGT TATAAGGATC CAATCTTTCA 
AGCAAAATAC GGAAAGTCGG AAGCAATATG GCTCCCGCTT GCGATCGCAG AGGCTGAGCA 
GGCAGAGCAA ACATCTGTTC TTCAATGGCG TAACATGGAG CAAAACAATA GACTTAGCCA 
ACATGTCTTA TCGAGCAGAG ATGACTACGG TCTTCAACCA CTACAACCAA CCAACTCGTT 
CGATTCTGTT TCTTTTCCCT CGCAGCTTAC ACCATCAATT CCGCAAGGCT TAGATCGACT 
TCATATATTG AATCTTTTAC AAGAGCAAGG GTTAGAAGTC GACAAAGACA TAGCGTCAAT 
TCTTCAATGT ACGAGTGTGC CAGTCAACGT GGCTAGGTGC CTCAAACAAA ATGGTCATGT 
AGTATAG

Protein sequence

MKQSRSSRSR VEKTVPKPPP TGPKTPSTLA ATVAAGKSFE TTERCGTCSA CLREDCGQCE 
GCVCKQKYGG DGSSKKQCVY RGCQAISEIN LKVGGGCFAS ATHNSDISSV LSISQYPPYP 
FTPPPSLIDV NKKRKPDLTI ADKKSMYGKL IPSESPRDHC SGCNLRQETI NDSVLICDGP 
ACGREYHLRC CVPALDIIPE GDWLCQDCSP SGSAETLMQY LESNDERRCD FQSSEEFVAS 
LISHDMVKEK VHRRPLSELE RATEIHRSAI GENWNLLISP DFYVGKPLRI YDGLANQYHS 
GRLVDCRQSL SCGTVEYLAR FPSGKDGRKS PLHHWIILEE HCLAIGTALI WSQTLGRRWK 
PAQLLLRTGR ELVSVASMYS EEQGEIRFTD SKHTLNALPS TPETDTTKPA ATPCSGSASR 
SAPSEPRFPI KKRRRNEVWG LVRFFGEGTF EFVPLTARAR SYKDPIFQAK YGKSEAIWLP 
LAIAEAEQAE QTSVLQWRNM EQNNRLSQHV LSSRDDYGLQ PLQPTNSFDS VSFPSQLTPS 
IPQGLDRLHI LNLLQEQGLE VDKDIASILQ CTSVPVNVAR CLKQNGHVV