Gene PHATRDRAFT_49576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49576
Symbol
ID	7198193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011691
Strand	-
Start bp	91309
End bp	92895
Gene Length	1587 bp
Protein Length	528 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002184392
Protein GI	219128379
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00024084
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCAGC ATTCAACTGC GATGAGTTTT ACCGGCCTCT TGGTCTTTGG AGCCTTGGGA 
GCGATATTGA TGAATCTGAT TTCAATACAT CAACATTTGG AGAAAGATGA AGGATCGCGT 
AGAGAGCAAG CGTCTACTTC TCTCCGAAAG GCTTTTGCAC GGAATTACTT CACGCCGGTT 
AAATCAATAG AGGTGCCCCC TAGCGCCGAC AAAATACGTG GATCTTTATC TTCGGCGGAG 
GAGCTGGGGG AAGCAGATCG CTTCATCGCG CAGGAGCCAT CCAAACGAAC TCTCCTAGAA 
GAAGTTCCAC CGCTTCTTTC CAGAGAAATC GACTTTGCGA AGCAATCCAA AACTCTTTCG 
ACAGCCAGCA ATCGCGAGAC TCAAAGAAAC GATACTACAT CGCAAAGTTT CGCGCTGACA 
AAACTACTCT CGTATGGCAA CCAGACGACG CCCAAGCAAC GTAGTGACGT TCCGGTTGAG 
TTCAAGGTAC AGACCTCTTC GCGGTTTGCC TATAGTTTTC TAGTTGGCGG TTGCGACCCC 
GATAACCCGA CCTACTTGGG GTACCTTTAC GACATTCTCG TATCGACGTA CATTCAAAGA 
CAAGACGGAA GTCGTTCGGA TGTGATGGTG TTCTTCCAAA TGGCCTACGA CTCGCCATAC 
GAGCACCTCC CCCCTGAGCA TACTCGTTTC CTCTACGATA TGAACATTCA ATACCAGTAT 
ATTCCGAAGC AGAAGGACGA GGGCTTCTAC CGTGTCACGC TAGAAAAGTT TCGCATTCTG 
ACCCTGACAC AATACGAACG GGTAATGTTT TTAGACGGCG ACGTAATGGC CCGAGGAAAT 
CTGGACTCTC TTTTCGAGCT GTCTACACGC GGTGTTTTGA AGGAGAATGT GGTCATGGCG 
GGCCGGGAAG AACCGGCCAA CGCAGGCCTA TTCATACTTG CTCCGCACGA AGGTGGCTAT 
GAACGTATTC AAGAGTTGAT TCGCGAAAAA GAAGAGCGCG GTCGGGCGTT GCCGTACCCT 
CACTGGGACG AAGACATTGG TTGGGGACAT AAGATTGAAG ATCCGGACTG GCACGAATTG 
ATTACAGGTG CAAAAGGTAC GAAATGGGAT TTTTACTGTT CGTACTCCGA TCAAGGGTTG 
CTGTACCACT GGATCAAATA CGAGCGGAAA TCGGCGTCTA TCTTCATGTC CAAACGCGTA 
CACAACTGGG GTGTTGATAG CGAGGAAGGG ACCGATGTCG TGTTACAGGA GAATCTTATC 
CTAAGCCGCG TCATGAGAAA AGTAGAGAAC GATCGCAAGT GCTACAAGGG GTCCATGCAG 
GGCGCTCAGT GCCGACCACC GTTCAACGAT TTTATCCATT TCACCGGTAC GAGCAAGCCA 
TGGATGCGAA AGCCTCCGGT GGACTTATCC GATGCCATGT CGGAAGAATC CCCGATGCAC 
TACTGGTATT ACATCTTGTC CAAAGTCAAC CAGGATCTGA AAATGGGTCT TGCTTTCGAG 
AACTGGGTGC CGTTGCAACG ACCAAAATTG GGACTGTTCC CCAGTATTGC CAAGGTTGCA 
AATGTTGTTA AAAGTAGAAA GCAATAA

Protein sequence

MRQHSTAMSF TGLLVFGALG AILMNLISIH QHLEKDEGSR REQASTSLRK AFARNYFTPV 
KSIEVPPSAD KIRGSLSSAE ELGEADRFIA QEPSKRTLLE EVPPLLSREI DFAKQSKTLS 
TASNRETQRN DTTSQSFALT KLLSYGNQTT PKQRSDVPVE FKVQTSSRFA YSFLVGGCDP 
DNPTYLGYLY DILVSTYIQR QDGSRSDVMV FFQMAYDSPY EHLPPEHTRF LYDMNIQYQY 
IPKQKDEGFY RVTLEKFRIL TLTQYERVMF LDGDVMARGN LDSLFELSTR GVLKENVVMA 
GREEPANAGL FILAPHEGGY ERIQELIREK EERGRALPYP HWDEDIGWGH KIEDPDWHEL 
ITGAKGTKWD FYCSYSDQGL LYHWIKYERK SASIFMSKRV HNWGVDSEEG TDVVLQENLI 
LSRVMRKVEN DRKCYKGSMQ GAQCRPPFND FIHFTGTSKP WMRKPPVDLS DAMSEESPMH 
YWYYILSKVN QDLKMGLAFE NWVPLQRPKL GLFPSIAKVA NVVKSRKQ