Gene PHATRDRAFT_48903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48903
Symbol
ID	7194976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011687
Strand	-
Start bp	641592
End bp	642798
Gene Length	1207 bp
Protein Length	394 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002183524
Protein GI	219126563
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAGTACTACG CCTTTCAAGC CCATGTCGAC CATTCGCGCT TCTGGTCGTG ATAGAAGCGG 
TAGTCCTCGC CAGAAAACCG GCAATGTCGT ACAAAACCGA GTCGAAAGCC CGTTCGTTAC 
AACTACCGAC GTTATGAGCG AAATCAATCG CCACTTAGCC GATCTTCACA AGCATAAGAA 
CAGCAGCGAC ACCGAATATA CAGGGGATGA GGACAACAAC AATTTGCGTA GCAAAAAAGC 
GCCACGCTTT GAACTACAGC GCAAATTTGG TGACGGAACA ACGCGCAGGG CATCACCAGC 
CGAACAAGCC GCTAACGATA TGAATTCTAA GCTCCAGCAA GTTGCAGTGC ACGTAGCCAG 
TCTCTCTACG ACACGAGAAC AGTATGCATG GGCCGAAGCA CAACGAAGTC TTGGAAATGA 
ATTCTATCAT CAACAAGAGT ATGAGCAAGC CATCGACGTC TACTTGACGT GTTTAATTGC 
TGTACAACCT CAAGACGAGT CAGACTGCCT GGTCCTAGTC TTGTTTCTAA AGGTCATGAA 
CAACCTCGCC CTATCCGCCC TACAACTCGG ATGGTACAAA AAGACCATTG ACTTCTGCAC 
CTTAGCCTTG GATCGCGTCA GGAAACAGCA ATCGCTTCAC TCACACCAGC AACACGTGCA 
ACTACAAATG ACCAAAATTT ATTACAAACG GGGCAAGGCA CGCCGGCTGC GAGGCGAGTA 
CAAGCAATCT CGTGCCGATT TGCGAGCAGC GCAATCGCAA ATATCGGTTG GCGAGTATAT 
CATTATCGAT GAATCACAGC AACAACAGAG CTTTCAAGAG GCGATTGACA AGGAATTCCA 
GCTGCTGCAC CAGGCAGAGT TCCAAGGCAG GCGCAACCAA GAAAAGCAGC AACGAGCCAT 
GCGGCAAATT CTCCTTCATT CGGGGGAGAA ACAGCTTGCT CTGGGCACAG CGACAGATCA 
AGCAGCCAAT GAATGTATCG CCTTATACGC GGAAAAAGCA TCCAAACGAA CATTTTCTGC 
GTTGCGTGCT CCAGCAACAT CCCTTGTGGA TGACGATAGC ACCTTTGACA TCGATGAAGA 
GTCGATGACA CCGACTTTGT GGCAATACTA TCTTACGGTT ATAGGTCGAG TTGCCGAGAC 
ATTGCTCTTT TGGATCGGAG ACGAGGAATA TGTGCAAAGT GTCTCGGAGC GGAAGAAAGC 
CATGTAG

Protein sequence

MSTIRASGRD RSGSPRQKTG NVVQNRVESP FVTTTDVMSE INRHLADLHK HKNSSDTEYT 
GDEDNNNLRS KKAPRFELQR KFGDGTTRRA SPAEQAANDM NSKLQQVAVH VASLSTTREQ 
YAWAEAQRSL GNEFYHQQEY EQAIDVYLTC LIAVQPQDES DCLVLVLFLK VMNNLALSAL 
QLGWYKKTID FCTLALDRVR KQQSLHSHQQ HVQLQMTKIY YKRGKARRLR GEYKQSRADL 
RAAQSQISVG EYIIIDESQQ QQSFQEAIDK EFQLLHQAEF QGRRNQEKQQ RAMRQILLHS 
GEKQLALGTA TDQAANECIA LYAEKASKRT FSALRAPATS LVDDDSTFDI DEESMTPTLW 
QYYLTVIGRV AETLLFWIGD EEYVQSVSER KKAM