Gene PHATRDRAFT_37648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_37648
Symbol
ID	7202462
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	-
Start bp	609520
End bp	610799
Gene Length	1280 bp
Protein Length	266 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002181765
Protein GI	219122880
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGGAA GACAGAATCC TGCCCACGGA CAGGCTCATA ACGGTCATGA ATATTGTCCT 
CTCTCGATCC TTCCAGAAGT GTACCGGTTC AAACGGCCAA ACGGAGTCAT GGCGATGACA 
AAAAAGTGCT GCCCACGCTG CGAAGCAACG GCGATACCTC TGACAGTGAG TAAAACCAGA 
ATGAAGAATA CATCAATTAT AGGAGTTGCA AATTCTCTTT CCTAGCTGAA TCCCTGACAG 
CCAAACTTTC TTTCAGCCCC CGCAGCAGCA ATGGGTGACA GAGAGCAACC GAAACCTACC 
GATCCTCGTC CGAGTATCTC CGACACAGCC TCCTTCGCAG GACGAGATAG ATTAAACACC 
CCAATGACTG CGCGTGACGC TGCTTTTCAG GCAAGAAGCC ACAATGGGCA AGCTGTTGAA 
CCACCTGTTC TACCGCGCCG ACGGAAAAAA CAGTAAGCCA GTTCTGTTTG GCTGAGATAT 
TGCTATTGAA CTTAGTTCTC AAGTAGCTTT TGTCATTGAA ACGCTTTAGG TATGCAGTAT 
CCGTCGCTTG GGAACGAGAA GTGGAACAAG GAACACTCTC GCGCGACATA AATACGTTTT 
GCTGCTGTTG CGCTCGTAGA ATTGGGAACA TGTTCGTACT TTGCAGCTAT GCAGACGGTA 
CACCCATCCT AATTGCTGGT CCTTGCTGGC CTTTTTGCGT TTTCGTCACT CTACCGTTGA 
TTATGGGTGT CGCTGGCCTG GTGTCTTTTT TTTTAATATT CGATGATAGG TTTGGATTGG 
TAAGTTTTAT ATATTTCTGA TTGTGGCGAC AACCTTTTAT TGTGTGACCT GATGTATTTT 
TTAGCCCTCT TGGTTGATCG CAATATATGG ATTGGCTGTC GGGGCAGTTT TGTTTTCGCT 
ATTCTGTGTG TCGTGCAGGG ACCCAGGTCT CATGGACCGC GTTGTGGACG AAGAAGCAGG 
TCAAGGGGGT TGGTTTTGGA ACGAGCAGGT GGGGAGCTTT CGTCCTCCCG GTGCACTTTA 
TTGTCGTGAA TGTGCCGTTC TTATCCAAGA TTACGATCAT CTGTAAGTAC CATTGTATCT 
TTGAATGTAG AAAGTTCTTT CGCCGGACAC AAACTGATCA TGTGCTTTCA ATCTTGTATT 
GAAGATGCCC ATGGACAGGT ACGGGAATTG GAAGAAGGAA TATGTGGGCG TTCAAAAGCT 
TTGTTGTGAC AGTCAATATA CTTTGTTATG CAAGTATTGG TCTTCTTTGC TGGGCGCTTC 
TTGACGGTCT GGCGTCGTGA

Protein sequence

MTGRQNPAHG QAHNGHEYCP LSILPEVYRF KRPNGVMAMT KKCCPRCEAT AIPLTPNFLS 
APAAAMGDRE QPKPTDPRPS ISDTASFAGR DRLNTPMTAR DAAFQARSHN GQAVEPPVLP 
RRRKKQIGNM FVLCSYADGT PILIAGPCWP FCVFVTLPLI MGVAGLVSFF LIFDDRFGLP 
SWLIAIYGLA VGAVLFSLFC VSCRDPGLMD RVVDEEAGQG GWFWNEQVGS FRPPGALYCR 
ECAVLIQDYD HLIGLLCWAL LDGLAS