Gene PHATRDRAFT_49656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49656
Symbol
ID	7198147
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011691
Strand	-
Start bp	324193
End bp	325593
Gene Length	1401 bp
Protein Length	399 aa
Translation table
GC content	46%
IMG OID
Product	predicted protein
Protein accession	XP_002184442
Protein GI	219128484
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0309902
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCAGTTGATT GTCGTTAAAG GTCGTTCGTA CAAATCAACT GGTCCCATAT AACTTGACAG 
ATTTCTTCTT GTTAGTACAT ATGGTACATG AAATTGGTCA GCTTCTGGGA CTTGTCCTGG 
GAGCGATAGT TTTCTGTCCA AGTAGACTGC ACGCATTCCA GCCAGCTGCC TCGCACTCGG 
GAAATCGCTT GAGACGTCTC CATTCTACAG CAGTAAATCA GCTTGAGGTA GACATAGCCA 
AACTGAAGAG GGTTCTGAAA AAGGAATATG TTTCGTTCTT TGACCCAATG GAAACCCAGT 
TTTATTCGCC ATCGGTATCT TTCATCGACC CCATGACGAG CTTTACAGGT GTCGAAAACT 
ATAAACGTAA TGTGGACATG CTTGCTGCAC GAACCTCAAT GGGAAAGTTT CTTTTCAAAG 
ACGCTGGTAT TGTTTTGCAC TCGGTAGAAG GCGGAGCTTT GAAATCTGAC GGCTCAATTG 
AGGATATATG TACTCGATGG ACTCTTCGAT TAACAGCTAA AATCTTACCA TGGAGTCCAA 
CTGCTCGCTT TTCTGGAATA TCAGTATACC AAGTCAAGGC AGGTGGGAGA AAAGGTGTTG 
AGATAATCAA ACAAAGTGAT TTCTGGGATT CCATCAATAT CCAAGAGGGT GGCACCTACA 
AAGAAGTCAA CAAAGGCCTC GCCATTTCTG ATTTTTTAAG CCAGCTGAAA CCTGAGGATT 
TAGCTGCGCC CTCAGCTGGA GCCGAGCTTC CCTATCAATT ATTGCGCCGA GGGAATGGCT 
ACGAAGTTCG ACGTTATCCC AGCCACAACG CCGTCGAAAT CAATTATGAG CGACGGGATG 
ATGGTTTTAG TATGCTTGGA TCCTTTACGA ACGGTACGTT CATCTGTTGA TGAATGTCAC 
TGTTGCTTTT GAATCTGAAA TTTACGTGTT TACTTTCCTT AGGGATGGAA CCATTGGCGC 
CGGCTTTGAT GGCCATCCCT TGCGCTGGAT CCAAAACGAT GATGTGGCCT TTGGATTTTG 
CTGCTCCCGG AAGCGACTAC CCACCCAAAC CTGCAGCCGC GCTCGAAAAA GCTAACGATG 
GCCTATGGAA TGATTGCCGT ATTGTCACGG TGCCGGAAAA GGTAGTCGCC GTGCGCCTTT 
TTTCGAATGC GAGTGTCGAG CCAGTCGTTC GGCAAGCCGA CAAGGAGCTT CGGGACGTTT 
GTCTACGGGA CGGTATCGGA ATACCTCTTT CGAGTGAATC GCTGTTGCAA TTCGCACAAT 
ACGATGCAAT ATTCAGTATG GGAAAGAGAA GAACGGAAGT TTGGATCGAC CTAGAGGATA 
GTAGCCATCC TTGGTCTCAC AATCAGTGAA AAGTACACTA TCATTGAATG TTAGATAAGT 
TAGCCCCTTC TAAAAAGGGT T

Protein sequence

MVHEIGQLLG LVLGAIVFCP SRLHAFQPAA SHSGNRLRRL HSTAVNQLEV DIAKLKRVLK 
KEYVSFFDPM ETQFYSPSVS FIDPMTSFTG VENYKRNVDM LAARTSMGKF LFKDAGIVLH 
SVEGGALKSD GSIEDICTRW TLRLTAKILP WSPTARFSGI SVYQVKAGGR KGVEIIKQSD 
FWDSINIQEG GTYKEVNKGL AISDFLSQLK PEDLAAPSAG AELPYQLLRR GNGYEVRRYP 
SHNAVEINYE RRDDGFSMLG SFTNGMEPLA PALMAIPCAG SKTMMWPLDF AAPGSDYPPK 
PAAALEKAND GLWNDCRIVT VPEKVVAVRL FSNASVEPVV RQADKELRDV CLRDGIGIPL 
SSESLLQFAQ YDAIFSMGKR RTEVWIDLED SSHPWSHNQ