Gene PHATRDRAFT_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_2037
Symbol
ID	7202519
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	+
Start bp	414078
End bp	415190
Gene Length	1113 bp
Protein Length	347 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002181552
Protein GI	219122438
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.417362
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATTATCATTG GTGTGCTTAT CTCTCTTTCC GCCCTCTTTT CGGGCTTGAC GCTGGGACTT 
ATGAGTCTAG ACAAGACGGG CCTCGAGATC GTTATGCACG GTGACGACGT CACTAACGCT 
CGCTACGCAT CCGATATTTT TCCCGTACGA GAAAATGGCA ATCTATTGTT GTGTACACTG 
CTACTAGGAA ACGTGGCCGT CAACGCGCTC TTGTCCATTA TGATGGGTGA CATTGCTGGC 
GGTCTGATAG GTTTCTTATC CAGTACATTT TTGATCGTCA TTTTTGGAGA GATCATCCCA 
CAAGCCGCCT GCAGCCGCTA TGCGCTGCTC ATTGGTAGCA AAACTGTCCC GCTGGTTCGT 
GTGATTCTTG TACTCTTCTA TCCAATTGCG GCCCCATTGG CTTATATGTT GGACAAGCTT 
CTGGGGGCCG AATTGGCCAC AATCTATTCC AGCGCCGAAC TTATGAAATT GCTACAGATT 
CACGTAGAAA ACGAAGCCAT GGATCAGGAT ACCGCAGTTG CCATGAGGGG CGCCCTCAAA 
TACAAGGATA CGACCGTCAA AGAAGTCATG ACGCCACTCA GCAATACCTT CATGTTGTCG 
GTTGACGAAA AACTCAGCTT TGAAACCATT GCGAAAATTT TTAAAACAGG ATATTCTCGA 
ATTCCAGTCT ACGAGATTTC AACGGTATGT TATTTTACTG GACCATGCGA GCTGCCGAAT 
ACGAGTGACG CTGGGCGTGT AAATGCTAAC TGCTAGCGTC TATCTCTTGG CTTCCAGAAC 
AACGTTATTG GCCTATTATT TGTGAAAGAC TTGATCTTCA TCGACCCGGA AGACGAAACA 
AGGGTGGCCG ACTTTGTCCA AATTTTTGGA CGAGGTGTAC ACGTTGTGTG GCCTGATGAC 
AAGCTTGGCG ATGTCTTGCG CGAGCTCAAG CTAGGCAAAT CTCACATGGC TTTAGTCCGA 
GACGTGAACA ACAACGATGC AAGTGTAGAT CCATTTTACG AGATCAAGGG CATTATTACT 
TTGGAAGACA TTGTTGAGGA GATTTTAGGT GATGAGATTG TGGACGAGAC AGATGCCTTT 
GTCGATGGAT CGCACGCCGT AAAAGTCGAC CGA

Protein sequence

IIIGVLISLS ALFSGLTLGL MSLDKTGLEI VMHGDDVTNA RYASDIFPVR ENGNLLLCTL 
LLGNVAVNAL LSIMMGDIAG GLIGFLSSTF LIVIFGEIIP QAACSRYALL IGSKTVPLVR 
VILVLFYPIA APLAYMLDKL LGAELATIYS SAELMKLLQI HVENEAMDQD TAVAMRGALK 
YKDTTVKEVM TPLSNTFMLS VDEKLSFETI AKIFKTGYSR IPVYEISTRL SLGFQNNVIG 
LLFVKDLIFI DPEDETRVAD FVQIFGRGVH VVWPDDKLGD VLRELKLGKS HMALVRDVNN 
NDASVDPFYE IKGIITLEDI VEEILGDEIV DETDAFVDGS HAVKVDR