Gene PHATRDRAFT_42434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42434
Symbol
ID	7196621
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	41016
End bp	42852
Gene Length	1837 bp
Protein Length	484 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002176508
Protein GI	219109507
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTCGT CCATGAGCAT GAACGAAACG GGAGCGTCTC CTTCTTCGGG AGGTGCTGTA 
CCTACCACCG GTGACTTTGT GGATCTCCAC GAACTCTCGA AAGGATGGAA AGCAGCAATT 
ACCAGAGCCA AGGACCCTTC TACAAGGTAC GCCGTTCCCT TCCGCCTTGT GCAGATCATT 
CCTCGAACCG ACAGTCGCGC ACTTGTGTAT ACACACTCAC ACTCGTATAC ACATACTCGT 
TGATACACAT TCTCACACAC ACACACTCAC ACCCACATAC ATACATACAT ACGTAGGTAC 
GAAGCGCGCG TCAAGAATGA TCGCGGAAAC TTGCCGTTGC ATTCGGCAGC GTCGTTCCGT 
GCTCCACTGG AAGTAGCCGA AGCACTCCTC GCGGCCTACC CGGAAGCGGC CTCCATCACC 
AACAACTACG GAAACCTGGC ACTGCACTTT ACGGCCTGGA AGAAAGGTCC TCTGGATGTG 
GAACAGCTAC TCCTCAAAGT GTTCCCCCAA GGGGCGGCGC AAAAGAACAA CCACGGCAAN 
NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNT CCATGGAACA 
GCGAGATGGC ATGACCGAAG AACGCGAAAT GGTGCTCGCC ATGTTGATGG ATATGAAGGA 
AAATCATCCG CACGCCTTAT ACTCGGCGGG CATTGATCCC AAGGCCGTCA CCGACTTGGA 
CTCCATGCTG GAACAGGTGC GCAAAGCTTC GGTTGAAGAA ACAATTCCTC CCGGGAGCAG 
TGACGAGGAA ATCGATGCAC AGCTTATTGA AGAATCACTA TGTCCTCCGG ATGATCCGGT 
CGAAGTGGCG TTGGCCGGTG TGATTGGATG TAGCGCGGTC AAAAACCAAA TCCGCGGACT 
GCGACGTACC ATTGAAATAG CCGCAGCTAC TGGTGAAGTC TCCAAAATCC CGCGTCACTT 
GGCCTTTATC GGAAACCCAG GAACCGGCAA GACCATGGTG GCCCGCAAAA TGGTCAACAT 
CCTGCGTAAC GTGGGAGCCA TACAGAGCCT CAACTTTGTC GAAGTGGGCC GTGAAGATCT 
CATTGACAAG AAGAGTGAAG CCCGGACCGT CTTCAAGACA CGAAAAGTAT TGGAACGTGC 
CGCCGGAGGG GTCTTGTTTG TCGACGAAGC GTACACTTTG TTGCCCTCAA CGGCCCGTCC 
GCGTGGACGC GATCACGGAG CGGCAGCTTT GCGGGAGATT GCCCGAGCAC TCCCCGGCGG 
AAACCCACTG GTCATTCTGA CCGGTGCACC CTTGGATCTG CAGCGTGTAC TCTCTAGCGA 
CATTGGTTTC AAGGGACACT TTTTGACCAG AATCGAGTTT CCGGATGCGA CCCCTCTACA 
GATTGCACAC ATGTTCATGG CAAAACTGTC CGAGAAGGGA CTCATGCCGG CCCAAGGTGT 
CACCCCACAG TACCTGGGTG AGCTGATCAA GTCGAATACG GAAGCCGAAT GGAGGCAGGA 
GCGAAACGGT CGTATTGCCG ACCTGTTACT GCTGGGCGTC CGGGCCGAAG TCAAGAAACG 
TGCCGTCTGG GACGATACCG CGTCCAAGGG ATCGTTGAGC CCCATGAAAA TTCTTAGCCC 
GGGATCTTCT CGCATGCCTG CTTTTGCCCC CGAAGAAGTA TTTGTGAATG TGGAAGATAT 
TCAGAATGCC ATTGTGAACG GCATGTAAAC GTTCAAATGC TAACCCGATC CTTGTGTTGT 
GATTGAGCCG TCGGGCGTCG AGCTTAGACG TGAACGGTAC GATCCGGGTT GCAGACGTCG 
TCTAGTTTAA CTACTACATA GCGAGCCGTT GCCGAAT

Protein sequence

MASSMSMNET GASPSSGGAV PTTGDFVDLH ELSKGWKAAI TRAKDPSTRY EARVKNDRGN 
LPLHSAASFR APLEVAEALL AAYPEAASIT NNYGNLALHF TAWKKGPLDV EQLLLKRDGM 
TEEREMVLAM LMDMKENHPH ALYSAGIDPK AVTDLDSMLE QVRKASVEET IPPGSSDEEI 
DAQLIEESLC PPDDPVEVAL AGVIGCSAVK NQIRGLRRTI EIAAATGEVS KIPRHLAFIG 
NPGTGKTMVA RKMVNILRNV GAIQSLNFVE VGREDLIDKK SEARTVFKTR KVLERAAGGV 
LFVDEAYTLL PSTARPRGRD HGAAALREIA RALPGGNPLV ILTGAPLDLQ RVLSSDIGFK 
GHFLTRIEFP DATPLQIAHM FMAKLSEKGL MPAQGVTPQY LGELIKSNTE AEWRQERNGR 
IADLLLLGVR AEVKKRAVWD DTASKGSLSP MKILSPGSSR MPAFAPEEVF VNVEDIQNAI 
VNGM