Gene PHATRDRAFT_38409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_38409
Symbol
ID	7203439
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011684
Strand	-
Start bp	25255
End bp	26621
Gene Length	1367 bp
Protein Length	440 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182598
Protein GI	219124622
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.377002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCAAA ACGGACCCAT CATCCTCATC ATGAACCAGT ATGCATATCT GGGAAAGGGT 
AGAACTATTC ATTCTAGTGC CCAGCTCGAG CACTACCACA ACCATGTTGA GGATCGCGCT 
TGTACCGTGG GCGGAAACCA ACGTATCGTC ACATTAGACG ATTACATTAT CCCGCTGCAT 
ATCAGGCAAG GCCTTCCTTA TATGGATATG CGCTATCCCA CCAATGAAGA GTTCGAGTCA 
CTATCCCATG TTGTCATCAC CTCCGATGTA GATTGGGATC CATCCGTCTT AGACAACGAA 
ATTGACCTCT CTGTGGAATG GTCCAGCAAC TTTCTTGATA TACCTGGTCA CCCCTATGTT 
GAACCACGCT TCGATAACAA CGGCCAATAT CTTCACCGCC ACGTCGCCTC GTGTTCATCC 
CTTCGTGAAG GTGCACTCGA CCGTTTAATA CAGTGTAAAC AGCATAATAT TGCACGCAAC 
GAGCATGACT ATGAAGCGCT TCGTCCATGT TTCGGATGGA TTTCGGCTGA CACCGTCCGA 
AAAACTCTCA TGGCCACAAC CCAGTACGCA CGAGAAGTAC ACAACGCCCC GTTGCGGAAG 
CATTACAAGT CCCGTTTCCC AGCCTTAAAT GTACACCGGC GAAATGAATC CGTTGCCACT 
GACACCATAT GGTCTGATAC CCCTGCCGTT GACAATGGTG CTAAATTCGC TCAACTCTTT 
GTTGGACGTC GTTCCCTCGT TACGGACGTC TATCCTATGA AAACGGATAA AGAGTTTGTC 
AATGCACTTG AAGACCACAT TCGTTATCGT GGTGCCATGG ACAAACTGAT CAGTGACCGT 
GCACAGGTTG AAATCAGTAA GAAGGTCACC GATATTAGAC GCGCCTATAA TATCGATCAG 
TGGCAGAGTG AGCCTAACCA TCAGCACCAA AATTTCGCTG AACGCCGTAT TGCAACCATC 
GAAGCCAATA CTAATAATAT TCTCAACCAC ACTGGTGCCC CTGATTTCAC GTGGCTACTT 
TGCGTCTCCT ACGTTTGCTA TGTGTTCAAC CATTTGGCAC ACGAATCTTT GAACAACCGC 
ACACCCCTAG AAGTTCTTAC TGGTTCTACC CCTGATATCA GTGTTCTTTT ACAGTTCCAC 
TTTTGGGAAC CGGTTTATTA TCGCCTTGAC GATGCGACAT TCCCTTCAGA TGGTACTGAA 
CAACGAGGAC GTTTTGTGGG CATCGCGGAT TCCGTCGGGG ACGCACTTAT TTATAAGATC 
CTCAACGACG GCACCAACAA AATTCTATAC CGATCTAGCG TTCGTTCTGC CAACATCCCA 
GGAGCAACCA ACCTACGCCT TACACAGGAT GGGGAGAGTG GTCCTAA

Protein sequence

MSQNGPIILI MNQYAYLGKG RTIHSSAQLE HYHNHVEDRA CTVGGNQRIV TLDDYIIPLH 
IRQGLPYMDM RYPTNEEFES LSHVVITSDV DWDPSVLDNE IDLSVEWSSN FLDIPGHPYV 
EPRFDNNGQY LHRHVASCSS LREGALDRLI QCKQHNIARN EHDYEALRPC FGWISADTVR 
KTLMATTQYA REVHNAPLRK HYKSRFPALN VHRRNESVAT DTIWSDTPAV DNGAKFAQLF 
VGRRSLVTDV YPMKTDKEFV NALEDHIRYR GAMDKLISDR AQVEISKKVT DIRRAYNIDQ 
WQSEPNHQHQ NFAERRIATI EANTNNILNH TGAPDFTWLL CVSYVCYVFN HLAHESLNNR 
TPLEVLTGST PDISVLLQFH FWEPVYYRLD DATFPSDGTE QRGRFVGIAD SVGDALIYKI 
LNDGTNKILY RSSVRWGEWS