Gene PHATRDRAFT_41501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_41501
Symbol
ID	7199372
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011699
Strand	+
Start bp	9823
End bp	11264
Gene Length	1442 bp
Protein Length	449 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002185470
Protein GI	219130644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.364066
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTTGC TGGAATCAAT CGGCGCTGCC GAGACTTCAG TACTGGCGGA AAGAAGCACA 
GAAAAGAAAG ACCTTTCCAG CAGAAGCACC AAAGAAACGA ATATTGACCT AATCGTCGAG 
CTGTCGATCA CGATCGGATA CGCCATTGTG ACGGGTCTGC TTGCCCGTTG GCTGATAGAT 
CGGTACTTGA CACCGCAACA ACTGACAGAT ACCGACCAAC CGTCTTCAAA GGAAGTATAC 
AAAGGGTTGC AACGGATCCT CCAAAAACGG AATCGCGGCA ACACTCAATT GCCGCAGCTC 
AATTCGTACG AGCTGCAAAT AGCGAACGAG ATTCTCGATC CAGACGATAT AGAAACCAAT 
TTTGCCGAAA TTGGAGGTTT GGATTCCACC AAGACAGAAA TCTACGAATT GGCGGTGCTG 
CCGTTGGTCC ATCCGGAACT ATTTACCGGG AAACTCGTAC AGCCTTGCAA AGGCATTCTC 
CTCTACGGAC GACCGGGTAC GTCAATGGTA ACGCACACAG CACAAACACG CCCCTGTTTT 
AATCGAGAAA CCTCTCACTT ACTCTCTCAT CCAACTTGGT CATATTAGGA ACTGGTAAGA 
CTATGCTCGC CAAGGCGTTG GCCAAAGAAT CCGAAGCCGT ATTCATTCCT CTGCAGCTGT 
CAAAACTCTT GAACAAATGG GTAGGGGAAT CGAACAAACT CATTGCCGGT GCCTTTTCAC 
TGGCCCACAA ATTACAGCCT GCCATCTTGT TCATCGACGA GATCGATACG TTTCTGAAAG 
CCAATGCTGG TGAAGGTGCA CAGTATCTCG ATACAATTAA ATCCGAGTTT CTGATACTAT 
GGGACGGTGT TGCTACCTCC ACCAATTCGA GAGTCATGGT GCTGGGGGCG ACAAACAAGC 
CGCAGACGAT TGATCCAGCC ATTCAACGGC GCATGCCGCG TACTTTCCAC GTCCCACTAC 
CGAATGTCGC AGGGCGTCAG GCTATTTTAA ATATATTTCT ACAGGAAGAG AAATTGTCAA 
TGGACGCACG AGCATGTCTT CCGGAATTGG CTAAGGCAAC GGTGAACTAT TCGGGAAGCG 
ACTTAAAAGA GTTGTGCAAG GCTGCAGCCA TGGTTGGGAT ACAGGAGCGC ACCGCCGAAT 
ATGCTCGGAA GCGTGTCATG GGCGAAAGTG TAGCTCTGGA TCAGACAATA GGAAATGCTC 
CCATGCGACC TATATCGAAA GATGACTTGT TGTCTGCTTT TTCCAAAGTC CAACGAACGG 
GGGCAGCAGC ACAAGCATAC GGCCGTCAAA CGGCACGGGA GGATGCTGCC GAGCAAGAGT 
CAGAAAGTCC AGCAGTTGAT GCGGAGGCGT TGCGCAACTT AACTCGATTT TTGCATTCAA 
TGTCGAATCT TTCCGTCGGC CAGAGCCGTG GGGACGGTAC AGATATCCCC GACCTAAATT 
AG

Protein sequence

MTLLESIGAA ETSVLAERST EKKDLSSRST KETNIDLIVE LSITIGYAIV TGLLARWLID 
RYLTPQQLTD TDQPSSKEVY KGLQRILQKR NRGNTQLPQL NSYELQIANE ILDPDDIETN 
FAEIGGLDST KTEIYELAVL PLVHPELFTG KLVQPCKGIL LYGRPGTGKT MLAKALAKES 
EAVFIPLQLS KLLNKWVGES NKLIAGAFSL AHKLQPAILF IDEIDTFLKA NAGEGAQYLD 
TIKSEFLILW DGVATSTNSR VMVLGATNKP QTIDPAIQRR MPRTFHVPLP NVAGRQAILN 
IFLQEEKLSM DARACLPELA KATVNYSGSD LKELCKAAAM VGIQERTAEY ARKRVMGESV 
ALDQTIGNAP MRPISKDDLL SAFSKVQRTG AAAQAYGRQT AREDAAEQES ESPAVDAEAL 
RNLTRFLHSM SNLSVGQSRG DGTDIPDLN