Gene PHATRDRAFT_47199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47199
Symbol
ID	7202188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	791589
End bp	792680
Gene Length	1092 bp
Protein Length	323 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002181263
Protein GI	219121833
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTTTCCCAGA TTCAGCTCAC TCTCATCTTT AGATACCTTC CTGTCAAACA TCGAGTTGAT 
ACTCGCTACC ATATTTATCG CCGCTGTAAA ACCAAACATT TCTGCTCCAA GAAAGCAAGA 
ATGATTCACC GGATCCTCTC CGTCCCGAGA AGCATCGTAA AGTCAAGTCG CCTGTCAGTT 
GCGAAACTTG GTACGCTACC GGTCTCATTC CCAAAAATTC GAACCTATTC GTCGACGGTA 
CCGGCAAACG AATCGAAGCC TTATCTTTCG GGAAATTCGA CTCATTTTGG TTTCGAACAA 
GTAGCCATCG ACCAAAAGGA AAGTCTCGTA CGTCAAGTAT TTGATAATGT CGCGGATTCT 
TACGATGTCA TGAATGATCT CATGAGCGGT GGACTGCATC GATACTGGAA AGACTATTTG 
CTGGAAGTAT CATCAGTGGA ATCCATGGCC TCGGCGGTTC GTCGCACCAA CGGGGACCTT 
CGTATTCTCG ATGTCGCAGG CGGGACGGGA GACGTCGCTT TTCGCTTTGT AAACGCGGCA 
GGATGCGTAG AACGGGCCAA ATCGTCCGGA GAAGACCCGG TTTCCGTCAC GGTCTGTGAT 
ATTAATCACG AAATGTTGCG TGTTGGAGAT GTAAGAGCAC GAAAGCGCTT CGGCAATTCT 
CTTTTGGATG ACAGCCGAGG CTTACGATTC ATGCAAGGGA ACGCCCAGGC GCTTGAGTTT 
GAAGACAACT CTTTCGATTT ATATACGATT GCTTTTGGGC TACGTAACGT GACGGATGTG 
GACATGGCGC TACGAGAGGC AAATCGTGTT CTCAAGCCGG GTGGACGATT CATTTGCCTC 
GAATTTTCCC AGGTTCCCAA CGAGCTGCTT CGAACGATCT ATGATACTTA CTCCTTTCAC 
GTGATACCCG CCATGGGTCA GATTGTAGCA CAAGATCGAG AATCGTATCA GTATTTGGTG 
GAGAGCATTC GGAGATTTTC AAATCAGGAT GAGCTGGTGA CTCGGATGAA GAACGCTGGT 
TTTCAGGTAT CTCGGTACAC CAATTTGACT GGTGGCATAG TTGCATTGCA CGAAGGCTGG 
AAGAGCGTAT AG

Protein sequence

MIHRILSVPR SIVKSSRLSV AKLGTLPVSF PKIRTYSSTV PANESKPYLS GNSTHFGFEQ 
VAIDQKESLV RQVFDNVADS YDVMNDLMSG GLHRYWKDYL LEVSSVESMA SAVRRTNGDL 
RILDVAGGTG DVAFRFVNAA GCVERAKSSG EDPVSVTVCD INHEMLRVGD VRARKRFGNS 
LLDDSRGLRF MQGNAQALEF EDNSFDLYTI AFGLRNVTDV DMALREANRV LKPGGRFICL 
EFSQVPNELL RTIYDTYSFH VIPAMGQIVA QDRESYQYLV ESIRRFSNQD ELVTRMKNAG 
FQVSRYTNLT GGIVALHEGW KSV