Gene PHATRDRAFT_19821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_19821
Symbol
ID	7199974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	+
Start bp	877540
End bp	878773
Gene Length	1234 bp
Protein Length	368 aa
Translation table
GC content	54%
IMG OID
Product	predicted protein
Protein accession	XP_002179311
Protein GI	219117033
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ACACACCTTT TCACAGTCAC GCACCGAGAT TTTAGTCATA CTATCGCACA AGTAGGGAGA 
CAGTCATGAC GGAGGCATCG AGTGAGAATG CGGGTGACGC TCCGGCCAAC GCCAACACGG 
GCTGCGTTGG GCCCACATCG GAAACGGCCG GCAAGGCTTC GGCGTGCGAC GGTTGTCCCA 
ATCAGAGCGC GTGCTCAACG GGGGCCTTTT CCTCCCCCGA AGCTGTTGCC AAGGCGGAAG 
CGGAAGTGGA AGCACTCAAT CGAAGTCTTT CCAACGTGTC GCACGTGATT TTGGTCCTTT 
CCGGTAAAGG TGGTGTGGGC AAGAGTACGG TAGCGGCCCA GCTGTCGCAC ACGCTGTCCA 
ACCAAGGCTA CGCCGTGGGG TTGCTGGATG TGGACTTGTG CGGACCGTCG GCGCCGCGGA 
TGGTTCTGGG CGACGCGTGT ACGTCACAAA CGATACACAA GTCGGGATCG GGTGCGTGGA 
CTCCCGTGTA CGCCAGCGCA AACCTCGCCG TCATGAGTAT TTCATTCATG TTGCAGGATA 
CCAATCAGGC TGTTGTCTGG CGGGGTCCGC GCAAAAACGC GCTAATTCAG CAATTTCTGA 
CGGAAGTAGA CTGGACGGGA GACACGGACG GACTCGATTA TCTCATCATT GATACACCGC 
CCGGTACCAG TGACGAGCAC ATTTCTACGG TCCAGTACTT GCAAAAGGCT TCCGCTGTAA 
GTGGGGCCGT TGTCGTGACC ACGCCGGAGG AAGTCAGCTT GGCCGACGTC CGTAAAGAAC 
TCAGTTTCTG TCGCAAAACG GATGTCCCCG TTCTAGGCAT CATTGAGAAC ATGGGATCCT 
ATCAGACACG ACTCTCACAA ATGGAATTTT CCAAAGACGG ACAGGATTGC ACGGCGCAGA 
TGCTCGCCGT TTTGCGAGAA AAATGTCCGG AAGTACTGGA TTGCGTTGCA GCTTCAAACT 
TGTTTTCGGT CAATGCGGGG GGAGCCGAAC AGATGGCCAC AGATTACGGT GTTCCTTTCA 
TGGGACGGTT ACCCCTTGAT CCTGATTTGC TCAAGGCTTG CGAACAAGGC AAGTCCTTCG 
TACAAACACA CCCCAATGCG AACGCCGCCG TGGCTCTGAA ACAATTTGCT CGTCAGCTCA 
ACAAGGTTCT TCCGGTCAAT ATGGATGAGT AAAACATTGG ACAAAGTAGG TAGTTTCTCA 
GCTGTAGAGC TTGTGTAAAC GACATTATCA TCTG

Protein sequence

MTEASSENAG DAPANANTGC VGPTSETAGK ASACDGCPNQ SACSTGAFSS PEAVAKAEAE 
VEALNRSLSN VSHVILVLSG KGGVGKSTVA AQLSHTLSNQ GYAVGLLDVD LCGPSAPRMV 
LGDACTSQTI HKSGSGAWTP VYASANLAVM SISFMLQDTN QAVVWRGPRK NALIQQFLTE 
VDWTGDTDGL DYLIIDTPPG TSDEHISTVQ YLQKASAVSG AVVVTTPEEV SLADVRKELS 
FCRKTDVPVL GIIENMGSYQ TRLSQMEFSK DGQDCTAQML AVLREKCPEV LDCVAASNLF 
SVNAGGAEQM ATDYGVPFMG RLPLDPDLLK ACEQGKSFVQ THPNANAAVA LKQFARQLNK 
VLPVNMDE