Gene PHATRDRAFT_48481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48481
Symbol
ID	7203765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011685
Strand	-
Start bp	624225
End bp	625506
Gene Length	1282 bp
Protein Length	384 aa
Translation table
GC content	58%
IMG OID
Product	predicted protein
Protein accession	XP_002182996
Protein GI	219125453
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCCATGCGG CGTATGGGAA GGAGGACGAC GACCTCAAAC TCACCGTCAA TCTGTACGGT 
TGCATCCTCC AGCCCATTCG GAAACAGCAA GGAATGAACG GAACGAGAGG CTTGTAAAAG 
TACTCGGATG ATTGCGTTAG AAGAGGCCCG GAATCTGGCC TTGACGGTTT GGCAACAACA 
GCAACCCCCA CCGGAAGTAT GGTCCGTCGT GTCGGGCGTT GCTGCCTTCT CGACGACGCT 
TGCTGCTTCG ACGTGGTGTC AACAGCGGAT CTTACGCATG TCAACGGGAA CACTCGCACC 
TTTCCCCTCT TTGGTGGGAT TCGCCACAGT GTGTGTCGCT TCGGTGGTCT CGCACCGAGT 
GTCTCTTTCC ACACTGCAAG TCGTACGTTC GGGAGACACG ACACCCTGGC GGTTCTGGGA 
ACAGTCATTT CAACGAGGAA ATAGTTTCGG CAACAATAGC AACAGCAATC CACACGCATC 
CTTCAGTTAC GCGGACAAAC ACCTCGAGTT GCCGGTCGGT CGTGTATCCT GGCATACACT 
CCGCATCTGC TGCATTGGCG TGGTGGCCTT CAAAGTACTC CTGGGCGGAC GTTTCTGGGC 
AATTGCCCCC AGTTCCTACA CACACTTGGG ATCCTTCGCC CGTACATCGT CCTGGATGAA 
CGGCAGTATC CCAGCGACGG CTCGTTACGC TTCTTCGGCG GAACGCCTTT GGGTGGAACG 
CATGGGTCGA CGCATCGGTT GTCACACCTG CGGTTCCCGT ATGGCGCACT CTCGAGCCGC 
CGTCAAGTTT GTGGGAGACC ACATGCCTCC CAAGGCCGTG GCGAATCAAC AGAACGCGCG 
TTGGATACGA CGACTCCTGG GCAACCCCGT GCAGTTTCGC TTCTTCCCGC AGTGTGTGCC 
GTGTTCTTCC AAACAGGGCA CGATTCTGGG CAAGGCCACC AGCGACTTGC GCGCGGCAAT 
CGCCAGTCCA GCGTCACTGT TTACGCGACG TTCATCGAAG CTACCCAATT TAGCACGCGC 
TGGTGGTGGC GTGCAAGCCT ACAATCACGG ACTCCGTCCA CGACTGCACC ATTTGGCGGG 
GGGCGTGGTG GGAGGTGTCG CGGTGCTGGG AGCCAACGAG GCGGACTTGA TGGACGAGAA 
TCGCTACCGG TACGCTCAAT GGCAGCACGA CTTACATCAA GCACTGCTTC AAGAAACTCC 
ACAACAGTGG CTCGAAGGTT TTCGACGAGG CTTGATGGCC GTGCGAGAAA AAGTATGGCC 
GAACGACGAT TCCTCCTGCT AG

Protein sequence

MIALEEARNL ALTVWQQQQP PPEVWSVVSG VAAFSTTLAA STWCQQRILR MSTGTLAPFP 
SLVGFATVCV ASVVSHRVSL STLQVVRSGD TTPWRFWEQS FQRGNSFGNN SNSNPHASFS 
YADKHLELPV GRVSWHTLRI CCIGVVAFKV LLGGRFWAIA PSSYTHLGSF ARTSSWMNGS 
IPATARYASS AERLWVERMG RRIGCHTCGS RMAHSRAAVK FVGDHMPPKA VANQQNARWI 
RRLLGNPVQF RFFPQCVPCS SKQGTILGKA TSDLRAAIAS PASLFTRRSS KLPNLARAGG 
GVQAYNHGLR PRLHHLAGGV VGGVAVLGAN EADLMDENRY RYAQWQHDLH QALLQETPQQ 
WLEGFRRGLM AVREKVWPND DSSC