Gene PHATRDRAFT_34965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_34965
Symbol
ID	7200157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	-
Start bp	769402
End bp	770814
Gene Length	1413 bp
Protein Length	470 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002179503
Protein GI	219117417
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGTGG ACACCGAGCT GACGACCACC GCGGTAGCTG TCGAAGGTCT CAACAACATC 
ATCACGGGAG GGCCTTCCCC GGATCAGCCG AATGAACGTT ACAAGGCGAT CAGTCTTTCT 
CATCTAGAAA AGGTTGCCGA AAAGCATCCA CAGCTCAAAC CACACTTGCG GGACATTCAG 
CTGTCTGGCC TCGTCTTTCC TTTCAAGGCT TCTCCCTACT ACGTTGACGA ATTGATTGAC 
TGGGAGTGCG AAGATGTCAG GGAGGACCCG TTTTACAAGC TTGTCTTTCC GACCATGGAT 
ATGCTTATCG AAGAACACCG TGAGAAGCTC GAAAAGGCGC ACAAAGCAGG GGACCCGGTA 
AAGCTGATCA AGACTGTAGC TGAGATTCGC GAAGATCTTA ACCCCCACCC GGCTGGTCAA 
AAGGAGCTCA ACGCTCCCAA AGAAGATAAG CTTACAGGTG TCCAGCACAA GTACAGTGAG 
ACAGTTTTGG TCTTTCCTGC CGCCGCTCAA ACATGCCACG CTTACTGCAC TTACTGCTTC 
CGATGGGCGC AATTCATTGG AGACGACGAA CTCCGATTTG CTCAAAAGGA GGCTACCTCG 
CTTTTTGAAT ATCTTGCCGA ACACGAGGAA GTCTCGGATA TACTCATGAC AGGAGGAGAT 
CCTATGATCA TGAAGACCAA GTCGTTGGCG CAATACTTGG AGCCTTTGAC CGACCCCAAC 
TTTCTGCCAC ACATCAAGAA CCTTCGGATC GGAACCCGAA GTCTTTCCTT CTGGCCCCAA 
CGATTCACCA CGGATGACGA TGCCGACGAG TGCATTGAAC TCTTTCGACG GGTACGTGAG 
CAAGGCAACC GTCACATTGC AATTATGGCT CATTTAGGAC ACGACCGTGA ACTCTCTACG 
GACAAATTCC AGGATGCCGT CAATCGCATT CAGAAGGAGG CCTACGCCAC CATTCGTTCA 
CAGAGTCCCA TTATGCGCGG AGTTAACGAC GATGCCGAAG TATGGGCCAG AAAGTGGCGC 
AAAGAGGTGC AAATGGGAAT CATTCCCTAC TACATGTTCA TGGCACGTGA TACCGGTGCG 
CAGCAGTACT TTGATGTACC TCTGGTTCGT GCCCACAAAC TTTACAGCGA CGCCATTCGC 
AATTGTTCTG GTTTGATTCG TACGGCCCGT GGGCCCTCTA TGAGCTGCAC TCCCGGAAAG 
GTGGAAGTCA CCGGCGTTGA AGAAATTATG GGACAAAAGG CCTTTGTTCT CCGGTTCTTA 
CAGTGCCGTG ACGAGGCTTG GATTGGGCGT CCCTTCTTTG CCAAGTACGA CGAGAAAGCC 
GTCTGGTTTG ACGACTTGGA GCCCCTTCCA GGGATGGAAT TGCCCTGGAA CGAGAAGGGC 
CTCCCTCGTC CTATCTGGCC CAGTTTGAAT TAA

Protein sequence

MAVDTELTTT AVAVEGLNNI ITGGPSPDQP NERYKAISLS HLEKVAEKHP QLKPHLRDIQ 
LSGLVFPFKA SPYYVDELID WECEDVREDP FYKLVFPTMD MLIEEHREKL EKAHKAGDPV 
KLIKTVAEIR EDLNPHPAGQ KELNAPKEDK LTGVQHKYSE TVLVFPAAAQ TCHAYCTYCF 
RWAQFIGDDE LRFAQKEATS LFEYLAEHEE VSDILMTGGD PMIMKTKSLA QYLEPLTDPN 
FLPHIKNLRI GTRSLSFWPQ RFTTDDDADE CIELFRRVRE QGNRHIAIMA HLGHDRELST 
DKFQDAVNRI QKEAYATIRS QSPIMRGVND DAEVWARKWR KEVQMGIIPY YMFMARDTGA 
QQYFDVPLVR AHKLYSDAIR NCSGLIRTAR GPSMSCTPGK VEVTGVEEIM GQKAFVLRFL 
QCRDEAWIGR PFFAKYDEKA VWFDDLEPLP GMELPWNEKG LPRPIWPSLN