Gene PHATRDRAFT_41008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_41008
Symbol
ID	7198834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011695
Strand	-
Start bp	124264
End bp	126735
Gene Length	2472 bp
Protein Length	823 aa
Translation table
GC content	55%
IMG OID
Product	predicted protein
Protein accession	XP_002185054
Protein GI	219129770
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGTCCG TCGTGACAGG AAACCGTGTT GCCGCGCTCT TTACCGTACG TGCTCGTCCT 
TGCGTGCGGC CTCGATCTAG GACGTTGCAT GGTTCCGTCG TCTCCCCTTC TCCGTGCCGA 
ATACCATCAC TGTCGGGTCG AAGGAATACT CCAGGAGCCC TAGGCACACA CGGCGTTTCC 
AACCGCTCCT TGGCTTTTCA ACACTCACCG ACTCTTTGGA ATCCCAACGT GGAGTCATTT 
ACCGACAATG CATCTCCCGA GAAGGACGTC CAACTGCGAT TCGACGTATC CAAATCCGAG 
GAATTATGGG TTGCAGAAAC GTCCCGTCTC CTTCGTTGGG ATGCTCCGTC ACCTACGTGG 
ACGGGGCGGG AGATTACGCA GGCTGAAGAA ACCATTCGCT ATTGGATTAC GAAACACCGA 
ACGAGACCGC AAACTATCCA AACCTGTCTC ACGCTTTTTG GGCGTACGGT CACGACGCTG 
GAATTGCACC CGCAGTTGCT GAAGAAGGAT GAATGCTTGG CCCACTGGTA CGACGGTCGC 
TATCCCCGCG CCACGCACTT GCTCAACGCC ATTGTGGACG CCTGGAGACT CTGTTGGATG 
GACAATGCCA ATGTCGTCAG CGCTAAACAG CTCTTTTCTC TGTTGGAGAG CTGGACGGCC 
GCGGCGCCGC CCGTCCCTAT TGACGCACGA ACCTACACTT TGCTCCTCAC GGCCGCTACC 
GCCAAGGGTG ACCCCACGCA GGCTCCTCTC TCTGGGCAAG AGTTGCTGGC CATCATGCTC 
GAACGCGGCG CCACACAACA GGCAGAATTG CCGGATACCT TTCTTTTCAC GGCCACCTTA 
CGAGCCTGGG CCCTCAGTGG ACGGGAGGAT GCCGCGCAAG GCGCATGGGC TCTCTGGAAG 
GACTGGCGTG AACTGCGCCG GGAGGGGACT GTGACGGCTA CACCCAATGT TGTGGCCTAC 
ACCACTCTTC TGGACGTCTT GACTGCGGCG GAAGACTTGG TGTACATGCA GCACGCCGAC 
CAGGTATTGC GCGATATGAT GGGGCACCTG CACGAGACCG TGACACCCGA CACGATCGCC 
TTTCGTCTCG TAATCTTCGG TTGGTTGCGC TGGGCGGGAA AGATGCCCGT AACTCTGCAC 
GCTGACGACG AGGAATCACC GAAACGGGAA AGTTGTCTAG TGGATGCACG GGACGAGAAC 
GATCCTGTCT CCATGCCTTT GCAAAAGGCG TACGGGCTGC TCCATACCAT GCTGGAACTA 
GATCAGAGCG GGATTGAAGG CGTCGCTTGT GATGCTACCT TCTTTTCCAA GTTTATTTCG 
GCGTCCGCGC TCGTCGGCCG TTTCGAAATC GCCCAAAAAG CCTACGACGA TTTGCTCGCT 
CTGTACGAAA AAACTGGTCA AGAACGATTC CGTCCCGAAA CATTCACCAA ACGTGCCATG 
ATTCTGGTCC ACTGTGGAGT TCACCGTGCC GTTTCGGCGG AAAAGCTCTT AATCGAAATG 
CAGGAAGAGG CGGCCGCCCG TGGTGATCCA TCTTTTTTAC CCAAGCCCAG TCACTACCGG 
GACGTGATTG TGGCATGGCT CACCCACCCC CGCGACACCA GAATTTCGCA ACGCGCCGAA 
GGTGTCTTGA TAAGGCTTAT CGAGCTGGCA AGTAGCATGG AAGACGAACA GGAGAAGGAT 
CGGTACATGC CCAATGAAAT GCTAATTGAA AAGGTTTTGT TGAGTTGGTC ACGATCTGAG 
CGCCAGGATG CCGCCTTTCG TGCCGAGGTA CTCTTACGCA CCATTCAAAA GTTGGTCCCC 
AACGCGGAGT CCTCGGTGTT GGGACCCAAT GCGTTCACCA ACGTCATGGT TGCGTGGTCG 
AGATCTAAAT CGCACGAGGC GGTGGGGCGT TGCGAGGATC TCCTGTTTGA ATTGCAACGA 
CGGTACGAGG ACGGTCTAGT CCATTTGCAA CCCGATGCCT TTCACTATAC GGCTGTAATT 
CGTACGTGGG CAAATAGTCA ACGCAGGGAC AGCGCCAGTA ATATTCAGGA TTGGTTCGAT 
CAAGCTGTAG AGTCATATCA GGCGGGCAAT CAACGGGCAC GCCCCGACCA ACACATGTAT 
GGAGCCGCCA TTCATGGATT TGGGCACGTT GGAGATGACC ACAAGGCAGA ACGTCTGTTC 
CATGTCATGA TCAAAGACTT TGAGCATGGC AATGAATCGG CACTGCCTTC TACGCGCATT 
CTCAACATGG TACTCTTTGC TTTGCTCCGT TCGAGTGACA CAGCTGCGCC CGAAAGGGCG 
TTGAAGATAT TGGGGGAGAT TGAAGCGCTT AGTCGAGTCG GCTGGTTCAA TGCATTTCCG 
GACGATCGAA GTTTATCCTT GGCTATTCAA ATTTTGTCCA AGGATCCAAC GGGCAAGTAT 
ACGAATGAAA TTACAGACTT TCATGACCAA AGAAAGCGAC TCGGAAAGTT TTCCCGACAG 
CGACGGTCTT GA

Protein sequence

MPSVVTGNRV AALFTVRARP CVRPRSRTLH GSVVSPSPCR IPSLSGRRNT PGALGTHGVS 
NRSLAFQHSP TLWNPNVESF TDNASPEKDV QLRFDVSKSE ELWVAETSRL LRWDAPSPTW 
TGREITQAEE TIRYWITKHR TRPQTIQTCL TLFGRTVTTL ELHPQLLKKD ECLAHWYDGR 
YPRATHLLNA IVDAWRLCWM DNANVVSAKQ LFSLLESWTA AAPPVPIDAR TYTLLLTAAT 
AKGDPTQAPL SGQELLAIML ERGATQQAEL PDTFLFTATL RAWALSGRED AAQGAWALWK 
DWRELRREGT VTATPNVVAY TTLLDVLTAA EDLVYMQHAD QVLRDMMGHL HETVTPDTIA 
FRLVIFGWLR WAGKMPVTLH ADDEESPKRE SCLVDARDEN DPVSMPLQKA YGLLHTMLEL 
DQSGIEGVAC DATFFSKFIS ASALVGRFEI AQKAYDDLLA LYEKTGQERF RPETFTKRAM 
ILVHCGVHRA VSAEKLLIEM QEEAAARGDP SFLPKPSHYR DVIVAWLTHP RDTRISQRAE 
GVLIRLIELA SSMEDEQEKD RYMPNEMLIE KVLLSWSRSE RQDAAFRAEV LLRTIQKLVP 
NAESSVLGPN AFTNVMVAWS RSKSHEAVGR CEDLLFELQR RYEDGLVHLQ PDAFHYTAVI 
RTWANSQRRD SASNIQDWFD QAVESYQAGN QRARPDQHMY GAAIHGFGHV GDDHKAERLF 
HVMIKDFEHG NESALPSTRI LNMVLFALLR SSDTAAPERA LKILGEIEAL SRVGWFNAFP 
DDRSLSLAIQ ILSKDPTGKY TNEITDFHDQ RKRLGKFSRQ RRS