Gene PHATRDRAFT_42521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42521
Symbol
ID	7196069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	288163
End bp	289641
Gene Length	1479 bp
Protein Length	492 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002176560
Protein GI	219109611
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACTGA TTTTACTATT GCTACACTTT CCTGTATGCT TCGGATTCCA CTTTGCGCCG 
CTGGATAGAG CACTAATCAA GCATGTCACG AGCAGCGATC GTTTGTCTCA CTTTCCGACG 
TTGCACCGAA AATGCCGTAG ACCTCGCCAC CGACAACCTT GTCGACCGCA CCAAGCGATT 
CCCATCGCTT CTATTGGAAT CGAAACGACC AGAGCTTTGT CAGGGCTTGT CGCGTCGTCC 
ATAGTTGGAT TCAATTTTGA TCGGATACTT CCTGATTCTG GGATTCTAGT AACTCTTATT 
TCAGCGGCAC TTATTTCCAA CGTGGGCTTG GCGCCCACGC TTCATCCACT ATACGATACG 
TGCTGGACAA CATTTTTGCC AGGATCCCTG ACCCTGCTTC TACTGTCGAT GCAGAAAAAG 
ACGACAGAAA CGTTTGCGAA TGGAGAATCT ATTTTGACGG TCGTTCGGAG AGTGTCTGTT 
CCCTTTGCTA TCGCTTCCGT AGCGTCCGTA TTGGGCTGTG CATTATCCTT TTGGCTATGT 
CTTACTTTTC CAATGCATCT TTTACCCAAA CAAGAAGCCA CTGTAGCAAC GGCATGTCAA 
GCAGCGTCGT TTGTAGGAGG ATCCGTTAAC TTTTTCGCCA CCGCAGCGGT TGTTGCCGAT 
CGATCAGTGT CTACACTGGT TAGTTCAATG GCCACCGCAG ATTTGGTAGT AACGGCCATT 
TTCTTCGCGA TTTTGAGCAC AGCGCTTCAA TCCCCTTCAC TGAAACGAAT GTTTTTGAAT 
GACAACGAGA GAGAAGCCCG AAACTCTGAC GTAGAAGACA TAAATGAGTC CACCAACAAA 
TCTACCGATA GCCCCGACCA GCCAACGCCA AGGAAGTCAA TTAAGGACGT TTCTCCAGCG 
ACAATGCTAC GTTTGACGAT ATCATCAATT CTGGTTTCGT CTGTAGCACT AGCGATTGTC 
CGCTTGGCCG AGCGCTTCGA AGCCGTGGTC TCGAGCATCA TCCCAGGGAC AGCATGTGCC 
GCTATCACAG TTCTCGCTCC GCTTGTTCCG AAATTTATGC CTCGCGACCT TTGGCTCTGG 
AAAGATATGC AGCGCGTCGC CGTTCCGCTT TCGCAGTTCT GTTTTTTGTT TTTGTTTGCA 
TCCATCGGGA TGTCGGCCGA TTTGACGGCC GCGTTGATAT CCGGCCCCGC TTGTCTGGTT 
GTTTCGTTGA GTGCTTTAGT CGTTCATTTG ATTGGTACAC TATTGGGTTG CTTGATTTCT 
CGCCGTTGGT TTCAGTCAGA ACTTCGTTTT GAAGATGTTT TGGTGGCGTC CAATGCAGCC 
ATTGGAGGAC CGGCGACTGC GGCTGCCTTT TGTGGTCGGA TAGTAGGACC TCGTCAAAAG 
GCTTTGACCT ACGCGGCTAC CATATGGGGT GTCGTGGGAT ACGCTATTGG CACAACACTT 
GGAGTAACTT TCTTTCGAAT CGCGCGACAA TTTTTATAG

Protein sequence

MRLILLLLHF PVCFGFHFAP LDRALIKHVT SSDRLSHFPT LHRKCRRPRH RQPCRPHQAI 
PIASIGIETT RALSGLVASS IVGFNFDRIL PDSGILVTLI SAALISNVGL APTLHPLYDT 
CWTTFLPGSL TLLLLSMQKK TTETFANGES ILTVVRRVSV PFAIASVASV LGCALSFWLC 
LTFPMHLLPK QEATVATACQ AASFVGGSVN FFATAAVVAD RSVSTLVSSM ATADLVVTAI 
FFAILSTALQ SPSLKRMFLN DNEREARNSD VEDINESTNK STDSPDQPTP RKSIKDVSPA 
TMLRLTISSI LVSSVALAIV RLAERFEAVV SSIIPGTACA AITVLAPLVP KFMPRDLWLW 
KDMQRVAVPL SQFCFLFLFA SIGMSADLTA ALISGPACLV VSLSALVVHL IGTLLGCLIS 
RRWFQSELRF EDVLVASNAA IGGPATAAAF CGRIVGPRQK ALTYAATIWG VVGYAIGTTL 
GVTFFRIARQ FL