Gene PHATRDRAFT_49741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49741
Symbol
ID	7198432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	-
Start bp	129071
End bp	130390
Gene Length	1320 bp
Protein Length	343 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002184573
Protein GI	219128759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAACA AACTAATCCG AGATTCGACG TTCCCATTTT CTGAATTCTC CACGATGGTG 
ACGCCGTCGT TGGCCATGGC AGTAATAGCA TTCATTTGCA CCGGAAGCCG TGTCTCTAAA 
CCTACGCATC TCACCAGACT TTTCAGTACG GTACCGTATA GAGAAAGCAC TCTGATATCG 
TCCACTAAAT CCAATACAGT CAAGAAGATC CAAGCGCTTT TGAATAAACG GAAAAAACGA 
CTAGAGCAAC GCGAGACCGT CGTGGAAGGA CCTCGGATGG TTGTCGACCT ACTGAAACAA 
CCACAAACCC ATCATTTGGT TCGAAGCATC TTTATTGCAT CAGACAAGTG GGAGCAGTAC 
TATCCTGAAA TCCTCCGGGC TGTCGGTGAA GACGAGAGCC GCCTACCACT CACGCTTCCT 
GTGACGCCAC CGGTCTTTGC CGCGTGTAGC GACACCATCA CGCCACAGGG AATTCTGGCC 
ATAACGGAAA TCCCCATTTT TTCATTGGAG AGAAGGGATG CTCCTCAAAA TCCGCTGTAT 
TTGGTCCTCG ATGGCGTGTC CGATCCGGGG AATCTGGGAA CTCTACTACG CTCAAGTGTG 
GCGACAGGTG TCGCTGGAGT GTTGCTGCTG CCCGGATCCT GCGATCCATG GGCACCGAAA 
GCTATTCGAT CCGCCATGGG AACGACTTTT CAAATACCAG TCGAAACTTT TGAAAACTGG 
GATGAATGCC GGGAAAAACT AGTACATTTG GGTTGCAACA ATTTTTGGGC GGCTACCATG 
TTGGAAGACG GAGTCGGCAG GTCCCATTAC GAGGTTAACT GGTTGAGTGG GCCAAATGCT 
TTGATCATTG GAAGTGAAGG AAACGGCCTG ACAAAACCGA TTCGGGATGA CCTAGCTGTC 
ACATCACCAA GGTTGAAATC TGTCTACGTT CCCATGAAAG CCGGTATTGA GAGCTTGAAT 
GCAGCCGTGT GTGGGAGTGT TATTCTGTTT GAATACATGC GTCAAGGGGA AACCAACGTA 
TCCACAAAGT GAATTGTGTG GACCCCAAGA TCTTGTTCTG GAACACCAGG TCAAGCGCAT 
AACTTCTCTT ACCCACTGAT TCTCGACCCA CCATATATTG GTAAGGCTTG GACAGGAGCG 
AACTGTCTCT ATGCGTGCAC ACACCCGCAT AAACTTTAAA GCCCTACTTT TATCTAATTT 
TCAAAGCTCA GGTTGGCCAC CAAAAGGTAT TTGGGAATTG GCACGAGACG ACGAGCATTG 
GAAGGGGACA TAAAGACACT GATTTGGTCT ACTAGTAGAG ATGGTTTCTA TTCATCCGTG

Protein sequence

MRNKLIRDST FPFSEFSTMV TPSLAMAVIA FICTGSRVSK PTHLTRLFST VPYRESTLIS 
STKSNTVKKI QALLNKRKKR LEQRETVVEG PRMVVDLLKQ PQTHHLVRSI FIASDKWEQY 
YPEILRAVGE DESRLPLTLP VTPPVFAACS DTITPQGILA ITEIPIFSLE RRDAPQNPLY 
LVLDGVSDPG NLGTLLRSSV ATGVAGVLLL PGSCDPWAPK AIRSAMGTTF QIPVETFENW 
DECREKLVHL GCNNFWAATM LEDGVGRSHY EVNWLSGPNA LIIGSEGNGL TKPIRDDLAV 
TSPRLKSVYV PMKAGIESLN AAVCGSVILF EYMRQGETNV STK