Gene PHATRDRAFT_48337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48337
Symbol
ID	7203556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011685
Strand	+
Start bp	151553
End bp	153713
Gene Length	2161 bp
Protein Length	678 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002182783
Protein GI	219125011
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAACGTAGGA CTGCGGCCAG TGCTCTTTGG AGAGGAAACG ACTAGAGCAT CCACAGTGAA 
CAAGGGTTTC ACTATCGATA ACCGCACGCA TTGCGACGGT AAGAGTCTGC CGTTTAGTGG 
CACCATGAAT TCGCTGTTTC ATCGATTGAA TGATCGCCGC AAATCCCGCA GAAAGTCCAA 
GGAAGACGAG CCGCAGTCAT CGTCTACTGC GGCACTGTCC TCGAAAGACT TGCAGAGTAC 
GGAATTGGAA CCCACAGCGA GACAAACCCG TCGGGAAACA GCGCGACGGC GGTCTACCAA 
AGTGTCGGAA TCGTCGAGAC GCAGTATGAA CGGCAATGCG GGCTCTCCGG TTGGTACATC 
AACCGTAAGT GTCAATGATC GCAGTCCCCG AACGAGGAAT ACAGACCCCC CAAGCCCCCG 
TCGATCCAAA CGGACTCTGC AAGGGGTACA AGAGGAGCAG CAAAAATCCA TCAATGCGTT 
GCTGGGAAAC GGAACTAGAA GACACCGTAC CTCGTTACCT TCAACGCCCG AAACACAACG 
CTCGACTCCT GGTTCCGTAG CCGACCGAAC ACGATTGACT CCAGCGGAAG CCACCGTGAA 
ACGACTACGA GCGCGACAAA GCAGACCACA TACCGGCAGT GCCAGTACTA GTGCCGTTCC 
CGAAAAGAAA TCTGTCAAAG ACAAGGAGCC GCCGCACGAT CAGCGTTCGG AAAACCTGGA 
AACCGAATCC GTCGTTGCGG ATCAGTGCAA TGAAGTGTCT CGACAAGCGG CAGCTTTGGA 
CCAGGAAGGA AACTCTTTTT TTGAAAAGGG CGAATATGAT CAAGCATTTT TGCGGTACGA 
AAAGGCACTG ACTTTGAAGC GTTCGATCAT GGAAGATTTC AAACCCCGCC TTGCCGCCAC 
AAAGGCTGCA ACTTCCGCAC AACACGAAGC CTCCCTCGTC GCCTCTGTCG CTACGTCTAT 
CAACAACATG ACATACTTGA AACAACGCGC CGGTCAAGCG TCCGCGGAGG AATCGCTGGC 
ATCTTATCTA AGAGCGCTTC AGATGAAGCG CGAAATTCTT GGACCCGATC ATCTGTCGGT 
GGGGAAGACG CTCAATAATA TTGGTTCCGT CTTTTATCTG AAACGCGAAT TTGAGCCTGC 
GCTCAAAGCT TACCAGGATG CCCATGTTAT TTTAGCGAAG CAACTCGGAG CCTCTCATTT 
GGATGTGGGG ACAATCATTT CTAATATTGG CGACGTGTAT GCGGCTATGG GGGAGCGTTC 
GCTTGCACTG GAAAACTACC ATAAGGCTCT GGACATCCGA TGGACGACTC TGGGGAAACA 
AGACCCCAAA GTCGTTCGCC TAATGCAACA AGTAGCCTCT CTGGAAACAG GCTCACAACC 
GCAGAAACCG GTGGGGGATT TATCGGATAG TGAAGACGAA GAGTTTGCCA GAGAAGATAG 
AGCCCGACAC GAGGTCATTC AGAAAGAGGT CAAAACGTTG AAGAAAGAAC TAGCAGAGGA 
TATGAAATTT TTTGATTTGA TGGAGCGACA AATGGCAATT GATATGGTGA AGGATAAAAC 
GAGGATCTTT CGAGAAATGC ATGATCTTGA CAAGCAAGGA AAGGAAGTTG GTAAGAATAG 
TGAAACAAAA TCCTCTACGG ACTTGGAAGA CAGCTTCTCG AGCGTTCCAG GCGCTGCATC 
GCCTAATCCA ATGCCAACCA TACCACACTC TCCGGTCATT GCTGCAGTGA ATGCGCAAAT 
GGAACGTAGG ACGCCGATGA AGTCGTCACC GCGGCTAGAA ACTCCGAAAT CCACGAAATC 
GTTGAGTGCG CAAGAACGGA ATGAGGCGCT TAGCAGCGTA CGCACGAGAC TAGCCAAGCT 
ACGAAACGAT CGTGCCGCAG CCGGGAAAGA CCAAAAAGAA TACGAACGAA AGTCGTACCT 
GGCCTCTCTG CAACAAAAGA AGAATGAGGC GACGCCACGA CGGCATTACA TGGACGCTAC 
CGCATCTTCT GCTGCAAAGT CCTCGTACAG TTTGTCTCCG ATACCCATCG CAGCCTCGCC 
AATTGCGCAT TCAGTGCCGG GTCAAACAAA GATCGATTGG AAAGAGAGCA TAAGCGCTCG 
ACGAAAACTC TCTTTGACGC CAGAAGTGGC TCCTATCGAT GTGGAGGTCA ATCGAGCCTG 
A

Protein sequence

MNSLFHRLND RRKSRRKSKE DEPQSSSTAA LSSKDLQSTE LEPTARQTRR ETARRRSTKV 
SESSRRSMNG NAGSPVGTST VSVNDRSPRT RNTDPPSPRR SKRTLQGVQE EQQKSINALL 
GNGTRRHRTS LPSTPETQRS TPGSVADRTR LTPAEATVKR LRARQSRPHT GSASTSAVPE 
KKSVKDKEPP HDQRSENLET ESVVADQCNE VSRQAAALDQ EGNSFFEKGE YDQAFLRYEK 
ALTLKRSIME DFKPRLAATK AATSAQHEAS LVASVATSIN NMTYLKQRAG QASAEESLAS 
YLRALQMKRE ILGPDHLSVG KTLNNIGSVF YLKREFEPAL KAYQDAHVIL AKQLGASHLD 
VGTIISNIGD VYAAMGERSL ALENYHKALD IRWTTLGKQD PKVVRLMQQV ASLETGSQPQ 
KPVGDLSDSE DEEFAREDRA RHEVIQKEVK TLKKELAEDM KFFDLMERQM AIDMVKDKTR 
IFREMHDLDK QGKEVGKNSE TKSSTDLEDS FSSVPGAASP NPMPTIPHSP VIAAVNAQME 
RRTPMKSSPR LETPKSTKSL SAQERNEALS SVRTRLAKLR NDRAAAGKDQ KEYERKSYLA 
SLQQKKNEAT PRRHYMDATA SSAAKSSYSL SPIPIAASPI AHSVPGQTKI DWKESISARR 
KLSLTPEVAP IDVEVNRA