Gene PHATRDRAFT_41150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_41150
Symbol
ID	7199097
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011696
Strand	-
Start bp	82801
End bp	83925
Gene Length	1125 bp
Protein Length	347 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002185202
Protein GI	219130081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.216905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATCG TTGTCTTCAA CGTTACGTTT TGGTTGGTGA CTTTGACCTA TCCCATCCGC 
GATCATTCTC AATCACAACA ATTGCGTGGT CGAGAGGAGC TGCGAAAAAG CACGAGAAAC 
GTGATTCGCC GCCCCCACAA GACTTCTCTT GATTTTGGAT CCCAATCAAT CGTTCCGCCT 
TCGCTATATT GTGCAAACTT TTGTAACGGG ATCATGAGGC ATCTAGCTGA AGCAGACTGG 
ATCGAAAGAT TAGACCCTCC CAGCCATCGA TTTCGCATTT ATCAGAGCAT GGATGATTTG 
AGCGTCTACG AACCTGAATA TGAGCCCGAG GAAGTGGTGA TCGCTAACGG GAAAGTGAGG 
CTGCAAGTAC TTTCCGTTGT TCCACCTCCT CTCGAATACA TGGCAACACT GCATGCAGAT 
CGACAAGAAA TTAGCGGTCG GCAAGTCTGG ACTGGATCTC TTGCACTTGC TCACGTTCTG 
GAACAGCATG AACCTGCCAA ACGCGACTTG CAGGCCAAAA GGTACGTTCG ATGGCGGGAA 
CGTCTTTTTC TTTGCAATGC ACAAGTCACC GTTTGCTGAA GAATACTTGA CTTTCGATAC 
AGAATACTGG AGCTTGGTAG TGGAACCGGA ATTCTTGGAA TGTCTGTCTC TAAGCTGTTT 
AACCCGGAAA TTGTTGTTTT GACTGATGGG GATCCCAAGG CTGTTGAATT GCTGGAGCAA 
AATCTGGACA ATCCGTTCAA CGAAATAGAC CTAGCTAAAA CGAGACTTGA AACACTAGTT 
TGGGGAAACG TGAAGCCATC TTTTGCTAAA AGTTGCAGAG CATTCGGACC GCATTGGTTG 
GAAGCAGAAA AAGTACAATT TGATAGTATA CTCGGAGGAG ATGTGTTGTA CAAGAACGAA 
TTGCCCGTGC TCTTCTTTAT TACCGTAAAA TGTTTACTGA AGCCGAATGG TGTGCTGTGG 
CTATGCCACA TCCCCCGGTC TACCGTGACA CAAGAAGTGG TAGTTAATGC AGCTAAAATG 
GCCGGCTTCC AGTGGGAAGT CGTCGACTTC AATTCAAAGA TACAAGGCTG CCCAGTTGAA 
GACGCAAATC GAGCACGAGT GTACAGACTG AAGCTTAATC CATGA

Protein sequence

MNIVVFNVTF WLVTLTYPIR DHSQSQQLRG REELRKSTRN VIRRPHKTSL DFGSQSIVPP 
SLYCANFCNG IMRHLAEADW IERLDPPSHR FRIYQSMDDL SVYEPEYEPE EVVIANGKVR 
LQVLSVVPPP LEYMATLHAD RQEISGRQVW TGSLALAHVL EQHEPAKRDL QAKRILELGS 
GTGILGMSVS KLFNPEIVVL TDGDPKAVEL LEQNLDNPFN EIDLAKTRLE TLVWGNVKPS 
FAKSCRAFGP HWLEAEKVQF DSILGGDVLY KNELPVLFFI TVKCLLKPNG VLWLCHIPRS 
TVTQEVVVNA AKMAGFQWEV VDFNSKIQGC PVEDANRARV YRLKLNP