Gene PHATRDRAFT_38787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_38787
Symbol
ID	7203810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011685
Strand	+
Start bp	207300
End bp	208556
Gene Length	1257 bp
Protein Length	418 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002182792
Protein GI	219125030
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTGC GTTCGACCAC TTTTAAGGTC GGTACTTTGT CGCTGCTTCT CATAGTCGCA 
ATCCAAAGCT CCACTCGACG ACTGGAAAAA CAAACTAAAA ATATTCAGCA AGGTCCTTGT 
GACGATGTAC GTCATACTTC GGGTCGCCGT TTGACGACGG CGACTGAAGA GGAAGCTCTC 
CGGCTCGCCA ACTATCTCCC GAATTTTCAT TTTTCAGAAC ACGTGCAAGT GTTGGGACCA 
ACGGTTTTCC CCAAGCCCAG CGACGTTGCC GAACAAGCAA GCGATGATGT TATTGTCCCG 
GCGCTCCAGC CCGTCATCGG ACAGCATCGA CCGGATCAAG ACGCTGTCTT CGCCTTTGCG 
GCGGAATATC CGATAAAGAA TTACGTGCTG TTTGTACAGT CGCTCCGCAA AACAGGATTT 
ACGGGAGACA TTGTTTTGTC CGTGCACGAG ATTGACTTAC GAAATGCCGA GATTCGAGCT 
TTTCTGTCCT CCGATCCGGG CGTTGTCGTT TACGCTCCAA GTACCGTTTG CTACAACGCC 
GAATTGGAAA CTGTTGAATC TGTAAAGGGA GGTATGCGCA CATGCCAAAC ACATAAACTG 
TGGGGGAAAC GCCATACGGA TGGCACCGTC ACGCCATTGC CTGATCCGCG TTCGCAACGT 
ACGGTTGCTA ATACGAGATA CGAAATATAC TGGATCATGG CATTGCAATA CGCTCCGCAG 
AGCTGGATTT TGATAGTCGA CGCCCGGGAC ACGGTTTTTC AATCGAATCC GTTTGCTGAC 
GTTCCTCGCC AAACTGATCC TACCGCCAAA TCTGGAGTTT TGTACTTTTT TGGAGAAAAC 
ATGGATGCCA CCCGTTTGGG CAAATCCAAA CAAAATTCCA AGTGGCTACA GAACGCCTAT 
GGTGATGTAA TAGGAGAGCA CTTGAAAGAC AAACCGACAA TATGTTCGGG CGCTTCCATG 
GGTGAACAAA TAGCATTGGA AGCCTACATT CGTGCCATGG TGGCTGAGGG AGACGAAACT 
GGAACTGTCC TGATGGGTTC CGACCAAGGC TTTCACAATC GCCTATTCTA CAGTCATAAG 
CTGGCTAACG CTAGACATAT CCACGACATT GTGGTCTTTG ATCAAGGCAC GGGAATCGTA 
AACAATATGG GAGCTTTGCG GACAAAATCG CTGACAGAGT GGGGGAATGG TAAAATCTTG 
AAAGAGGGCG CAAAAGGGGA ATATTCAGTT CTCAATTGGG ACGGAACAAA GAGGTAG

Protein sequence

MSLRSTTFKV GTLSLLLIVA IQSSTRRLEK QTKNIQQGPC DDVRHTSGRR LTTATEEEAL 
RLANYLPNFH FSEHVQVLGP TVFPKPSDVA EQASDDVIVP ALQPVIGQHR PDQDAVFAFA 
AEYPIKNYVL FVQSLRKTGF TGDIVLSVHE IDLRNAEIRA FLSSDPGVVV YAPSTVCYNA 
ELETVESVKG GMRTCQTHKL WGKRHTDGTV TPLPDPRSQR TVANTRYEIY WIMALQYAPQ 
SWILIVDARD TVFQSNPFAD VPRQTDPTAK SGVLYFFGEN MDATRLGKSK QNSKWLQNAY 
GDVIGEHLKD KPTICSGASM GEQIALEAYI RAMVAEGDET GTVLMGSDQG FHNRLFYSHK 
LANARHIHDI VVFDQGTGIV NNMGALRTKS LTEWGNGKIL KEGAKGEYSV LNWDGTKR