Gene PHATRDRAFT_43494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_43494
Symbol
ID	7197546
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	626125
End bp	627660
Gene Length	1536 bp
Protein Length	456 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002177971
Protein GI	219112439
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0119061
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AGATCAATCG CGTTTTTTCG GCTTCAAAAT GAAAGTTGCT TTTGCCTTCC TATGCGCCTT 
CGCAGCGAAA GCCTCCGCGG ACAATTTCCT TGAAGGTAAG TGATGGTAAT CTAGGAAGTT 
TTCTCAGGAA AGGGATAAGT TGTTACAGTT AACTGTCCAT GCCGATCGCA GACTGGAAGA 
ATAAGGGAAA CCTCGCACCT TCTGACACCT GCAACATCCC TTCTATCTGC AGCTGGACTT 
CGAAAGCTCG AGGGAGCAAC CGAAAAGTGC TCCGATAAGA TAGTGAATTT CGAGGGTTTC 
TCTGCGGGAG AGAAAGTCAC TACTGAGAAG TTGAAAAGCT TGGGATTTAA AACGCTCTCC 
ATCAAGGTGG AAGGCAAGGG AAAGTGCGTC GACGGCGAAG CTCGAATCTT CAACTCCGGC 
AGTGTCACCT GCGGCGACAC TGACTTGTCC TCTAGCGATG GCATGGTGGC CATTATTCAG 
GAGAAGAATG AGAACATCTG CGCTCCCAAT GATTGTGCCG CTGGAGGCAC AATGACTTTT 
GAGTGGACTA ACAAGGTTCA AATCAAGTCC ATCCGTCTCT TGGACAATGA CCAGCCCGTC 
AAGGTCGTTC TTACAACGTC CACTGGTACG ATTACAAAAC CACTGGTTCT TGTTACAGAT 
AAATCCAAGG ATGGGAAACA CGAAACTTTT TCCATCGGAG TAGATGATGT CTCGAAGATG 
GATGTGGTTA TGAACGGATC TGGTGCCGTG GCAGAAGTGG TGTACAGAAC TTGTGGAACT 
GGCGCTAGCG GAGACCCGCA TTTTAGCACC TGGACTGGAC ACAAGTTCGA CTACCACGGG 
CAGTGCGACC TTGTGCTTGT CAAGGCCCCG GTTTTTGAAG GTAAAGGCCT CGACATTCAC 
GTACGCACCG AGCAGCGCTA CTTCTACTCC TTCATCAAAA CAATCGCGAT GAAGATTGGA 
GATGATTTGC TGGAGTTTGG ATTCAATCAA GTGCTCCTGA ACGGTGCCAC TGCCAACAAA 
GGCTTGACTT CGGGAAGCAG CTTCGACTTC GCGGGATATC CTGTGTCGTT CCACGACGAG 
CCCATGCCCA ACGGACGTCC CCGTAAGCTA TACCGTGTTC AGACCCCGCA CGAGGCTATC 
GTCATCAAGG TTTTCAAGCA GCTGATGGCT ATTGAAATTG AAGATGCGTC TCACGTTAAT 
TTTGCAGATG CCGTTGGTAT CACGGGCGAC TACAACTCTG GTCTGATGCT GGGCCGTGAC 
GGTGTCACCA TATTGCCGGA TCCCAGCGAC TTTGGTCCGG AGTGGCAAGT CACCAGCGAC 
GACCCTAGCT TGTTCAGTTC CGTGCAGGCT CCCCAGTTCC CCGAGAAGTG CTGGGAAGCC 
CCGGCTATTG ACAAGGTCCG CCATTTGCGC AACGGAGTGT CACAGGCTCA AGCGGAAGAG 
GCCTGTGCGA TCTTGGGAGA AGACGCTGAT ATTGAAGACT GTGTGTTTGA CATTATGGCC 
ACCGGAGATA TCGAGATGGT CGGCGCGCAC CTCTAA

Protein sequence

MKVAFAFLCA FAAKASADNF LEAGLRKLEG ATEKCSDKIV NFEGFSAGEK VTTEKLKSLG 
FKTLSIKVEG KGKCVDGEAR IFNSGSVTCG DTDLSSSDGM VAIIQEKNEN ICAPNDCAAG 
GTMTFEWTNK VQIKSIRLLD NDQPVKVVLT TSTGTITKPL VLVTDKSKDG KHETFSIGVD 
DVSKMDVVMN GSGAVAEVVY RTCGTGASGD PHFSTWTGHK FDYHGQCDLV LVKAPVFEGK 
GLDIHVRTEQ RYFYSFIKTI AMKIGDDLLE FGFNQVLLNG ATANKGLTSG SSFDFAGYPV 
SFHDEPMPNG RPRKLYRVQT PHEAIVIKVF KQLMAIEIED ASHVNFADAV GITGDYNSGL 
MLGRDGVTIL PDPSDFGPEW QVTSDDPSLF SSVQAPQFPE KCWEAPAIDK VRHLRNGVSQ 
AQAEEACAIL GEDADIEDCV FDIMATGDIE MVGAHL