Gene PHATRDRAFT_11735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_11735
Symbol
ID	7199957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	-
Start bp	804799
End bp	805968
Gene Length	1170 bp
Protein Length	389 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002179511
Protein GI	219117433
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATGG AACAACAGAA GCAGGAACTT GATTTCTATC AGGAAGTCAA GGGCCTTGAA 
AAGCAGCTCG AATTCGTCTC TCTGCAAGAA GAGTACCTGA AGGACGAAAT GCGTCACCTG 
CAGCGAGAAC TTTTACGGGC AAAGGAAGAG GTTCGCCGCA TTCAATCGGT TCCTCTCGTG 
ATTGGACAAT TTAACGAAAT GATCGACGCC AAGTACGGCA TTGTTTCCAG TACAGCTGGT 
TCCAATTACT ACGTCCGCAT CCTTAGTACC CTGGATCGAG AGCTCTTGAA GCCTAACACG 
TCTATTGCAT TACACCGTCA CTCTCATTCT GTGGTTGACA TTTTGCCGCC GGAGTCTGAT 
TCGACGGTTA AACTCATGTC TGAGAAGCCT GACGTGACTT ACAAAGATAT TGGTGGGATG 
GATATACAGA AACAGGAAGT TCGCGAAGCG ATCGAACTTC CTCTCCTCCA ACATCACCTA 
TACCAGCAAA TCGGAATTGA TCCTCCCCGG GGTGTCCTTT TGTATGGGCC TCCCGGTACA 
GGAAAAACCA TGATGGCAAA GGCGGTGGCC AACGCTACCA AGGCGACCTT TATTTCCATG 
GTTGGGTCCG AGTTCGTGCA AAAATACCTA GGTGAAGGTC CCCGTATGGT GCGTGACGTC 
TTCCGTTTGG CGCGGGAAAA TTCCCCTTGT ATTGTCTTTA TTGATGAGAT CGATGCCATT 
GCGACCAAGC GGTTTGATGC TCAGACTGGG GCCGATAGGG AAGTCCAGCG TATTCTCCTA 
GAACTGTTAA ACCAAATGGA CGGTTTCGAT CAAACGACCA ACATCAAGGT CATTATGGCA 
ACCAATCGTG CGGACACGCT AGATCCTGCG TTGCTACGTC CGGGACGGTT GGACCGTAAG 
ATTGAGTTCC CCAATCCCGA TCGACGACAA AAACGCATGG TCTTTCAAGC CGCTACAACC 
AAAATGAACT TATCGGACGA GCTGGACTTG GAAGACTACG TGAACCGGAG CGAAAAGGTT 
TCGGCGGCCG ACATCTCGTC GATATGCGCC GAAGCTGGGT TGCAAGCCGT GCGTGAAAAT 
CGGTACGTCG TATTGCCAAA GGACTTTGAC GCGGCCTACA AGAAAGCTGT CAGCAATCGT 
GAAAAGGAGC ACAATTTTTA TACTATGTAA

Protein sequence

MDMEQQKQEL DFYQEVKGLE KQLEFVSLQE EYLKDEMRHL QRELLRAKEE VRRIQSVPLV 
IGQFNEMIDA KYGIVSSTAG SNYYVRILST LDRELLKPNT SIALHRHSHS VVDILPPESD 
STVKLMSEKP DVTYKDIGGM DIQKQEVREA IELPLLQHHL YQQIGIDPPR GVLLYGPPGT 
GKTMMAKAVA NATKATFISM VGSEFVQKYL GEGPRMVRDV FRLARENSPC IVFIDEIDAI 
ATKRFDAQTG ADREVQRILL ELLNQMDGFD QTTNIKVIMA TNRADTLDPA LLRPGRLDRK 
IEFPNPDRRQ KRMVFQAATT KMNLSDELDL EDYVNRSEKV SAADISSICA EAGLQAVREN 
RYVVLPKDFD AAYKKAVSNR EKEHNFYTM