Gene PHATRDRAFT_31975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_31975
Symbol
ID	7196454
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	1383425
End bp	1384807
Gene Length	1383 bp
Protein Length	397 aa
Translation table
GC content	46%
IMG OID
Product	predicted protein
Protein accession	XP_002176774
Protein GI	219110044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACCAT TACCTTACAT GGATCATGTG CAGGCTACAT TGAACCCATG CAGCGTTGAA 
ACAATTCCTG AACCCATAAC TCTGGCGGAT AGCTCAAAGG TCTGGCCCTT GGTTGTCTCT 
TGCTACGAGT TGGACGAAGC TTCCGGTCGT CGGAACGGCA AAGCAGATAT GTTTACAGTT 
CCGATGCCTG ATATCTCGGA AGATAAGGAA ACGACTCTGC CACTAAAGTT TGGAAGTCCC 
CATACTTTCA CAGACAAAAT ATCAGGGATT CTTGATGGCA AATGGTCCGA ATTTTATAGC 
CCGGGCGACA ATTCCAAATC ATGGTGTTTC GCGACAGCGC AATCATCAGG CGAGATTCGT 
TCTTTCCGTT TGCAAATCCC ACGATCTTTA GAAGGATATC CCCCGGTGTC AAAGTCAGAT 
CCGTTGTACA CAATTGCGGA AGCGGGCGCC AGCGAACCAC CTGAAGATGA TGACGGAGCT 
CCGCTATGCT TGTCTTTAAA TTGGGAACCA TCATCTCAAT GGAATAGCAA ATCCGGTATG 
AAACGAATAG TGTCCACGTA TTCAAATGGG ACTGTCGCAA TTCATGATGT ATCATTTTCA 
TCTGGTTCTA CGCATTTCAT TGCCAGGGAA AGTTGGCGAG GTAAGTGCTC CTTTTACCGG 
AAAGAATTTT GTAGGTACAG TGATAGCACG CTTAAAATAT TCGGATCTTA TTGCTCACTG 
ATCAGCACAT AGTATATTCA CAAGTCCTGC AGAAGTTTGG TCAGCGTCTT TCGCGTGTGA 
CGGGGACCAA AATATGATTC TTTCCTGTGG CGATGAAGGA TCAGTGAAGG TATGGGATAT 
TAGGAGTAAT GTTCGACCCA TGCACGAATT GAATTTTTTT GAATCCGGAG CAACGTGCGC 
TTCGCATCAT CCTCGGCACG AGCACTTGGT TGCATGTGGT TCTTATGACG AGAGAGTTTG 
TATCTATGAT ATTCGATATC TATCTCAAAA GCCATTGTTT CGAAGTGATT CCTTAGGAGG 
GGGAATATGG AGACTTAAAT GGCATCCATA CTCCGACCAG AAGTTACTTG TTAGCGCAAT 
GCACGGCGGA TGCCTTGTCC TACGCGTAAG CCAAGATGTT GGAGTAGAGA GCGGAATTGT 
AGACGCGCCG AGTTTTGAAG TGACAAAAAC GTTCACTGAG CATGAGAGGT ACGTCTTGTG 
TCTAATGAAA TGCCGCAGTC CCTGATCGAA ATGCACTAAA ATCAAATCTT GTCATTTTTA 
TGCAGTATGG CGTACGGTGC CGATTGGCTT GTGAGTGGCA ATCCAGCGCA GAAGACCTAC 
TTTGAAGCTG CAGCTAGTTG TAGTTTTTAC GATCGGAGCA TCTTCCTCTG GGAAACGGTA 
TAA

Protein sequence

MAPLPYMDHV QATLNPCSVE TIPEPITLAD SSKVWPLVVS CYELDEASGR RNGKADMFTV 
PMPDISEDKE TTLPLKFGSP HTFTDKISGI LDGKWSEFYS PGDNSKSWCF ATAQSSGEIR 
SFRLQIPRSL EGYPPVSKSD PLYTIAEAGA SEPPEDDDGA PLCLSLNWEP SSQWNSKSGM 
KRIVSTYSNG TVAIHDVSFS SGSTHFIARE SWREVWSASF ACDGDQNMIL SCGDEGSVKV 
WDIRSNVRPM HELNFFESGA TCASHHPRHE HLVACGSYDE RVCIYDIRYL SQKPLFRSDS 
LGGGIWRLKW HPYSDQKLLV SAMHGGCLVL RVSQDVGVES GIVDAPSFEV TKTFTEHESM 
AYGADWLVSG NPAQKTYFEA AASCSFYDRS IFLWETV