Gene PHATRDRAFT_49988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49988
Symbol
ID	7198772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011694
Strand	-
Start bp	43966
End bp	45504
Gene Length	1539 bp
Protein Length	452 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002184881
Protein GI	219129407
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAGA ACCAATTCGT TCGCGGTTAT CTGTCCTATG TGCCAATCGC TGTTTGTGCG 
CTGTACCTCG TTGCATCGCC TGCGAAACTG GTAGCGGCTC ACAGTCAATG GAAGGTGCAG 
AATAGGCATC GTCAAACGAA ACTGTATGAA TCAAGCAAAA GTCCTGCAGC CCGCAGCGTC 
ATAGCAGATC TACGCGGAGG TTCACAGCCA AGGCACTCCT CTGCGGATGT CCGAGAAATT 
AATTCTACTC TAGATTTCAC CAACCCTTCC CTGATAGAAG AGGGACCCCA TTTAAACGCG 
TTGGATTCAC AGTCAGAAGC AGATCGGTTA CGGAATCTGG ATTTGAATAC ATCGGCAGCT 
CTGCCAATTC CGGCATGGAG GGAGCATTTG CCTCCACCGC TGCGTCTAAA GAAAAATACA 
TTGCAACGAG TCCGGATAAA GAACGTTGAG ATCTTCTTGT TGGGCACGGC ACACGTTTCC 
AGCGATTCTA GCGAGGAAGT TAAACTTCTG CTCCGTCATG TGCATCCCGA CGCTATTTTC 
GTTGAGCTTT GTGAAGCTCG CATACCTCTT CTTGAAGGAA CTGCGAAGGA CGAACACGAA 
GAAGAAGCAT TGGCACACCA GAATCGCACG ATGCGTGAAA AGATACGGCA GGTACAGTCC 
ACACAGGGAG GCTCCCGTCT TCAAGCTCTT TCCACAGTTT TGTTGACTTC TGTCCAAGAA 
GACTATGCAT CCGAGTTGGG AGTAGAGCTG GGAGGCGAAT TTCGGGCCGC ATACCAATAC 
TGGCAAGCGC AACAATCCAT ACCGACTGGA ACAAGTTCTC AATCTTGTGC TTTGATTTTG 
GGCGATCGTC CTCTACAATT GACACTTGTA CGTGCCTGGG AGTCTCTCGG GTTTTGGCCC 
AAGGTAAAGG TTTTGCTAGG TCTGCTTTGG AGCTCATGGC AAAAGCCGAA AAAGGAGGAA 
ATCCAGGAGT GGCTACAGTC TGTGCTTCGG GACGAAACAG ATGTTCTCAC GGAAAGTCTG 
AAAGAACTGC GCCGTCATTT CCCTACCCTT TTCACAGTAA TTATTGCAGA ACGTGATGCA 
TGGCTAGCTG CCAAGCTTGT ACAAAGCTGT CGAGTATTAT CGGCCTCAGC AACAGCAGCT 
TCTCCTGTAT GCACGGTCGT GGCCATCGTT GGTGCTGGAC ATATCCCGGG AATTGTAGCC 
TGGCTGACCA CGCCTCCAGC CGATACGTCT ATCACGCCTG AAACAGTACT ACGCGACTTG 
GTCACCACAA AGCGTTGGGC TCACGATGAC GCTATCCAAT TGCAAGCTAT CCCGGCGTGG 
ATTTACGAAG TTTCTCACTT GCAGCCCAGT GCCTCGTAAA AAAACACGCC GGCGCGATGC 
GAAATGCTTG GATGATACCT TCAACTTCGG AAGGGCCTCC TTTGCCCTTT TGTCTAATCA 
ACTGATAAAC CTTTCTGACT ACCGCTTTTG ATCATTGCGA GGGAGATTGG ATTGGCTTTG 
CAAAGCTTAA TCTAGTGTCA AACTTTAAAA TATCATCTC

Protein sequence

MGKNQFVRGY LSYVPIAVCA LYLVASPAKL VAAHSQWKVQ NRHRQTKLYE SSKSPAARSV 
IADLRGGSQP RHSSADVREI NSTLDFTNPS LIEEGPHLNA LDSQSEADRL RNLDLNTSAA 
LPIPAWREHL PPPLRLKKNT LQRVRIKNVE IFLLGTAHVS SDSSEEVKLL LRHVHPDAIF 
VELCEARIPL LEGTAKDEHE EEALAHQNRT MREKIRQVQS TQGGSRLQAL STVLLTSVQE 
DYASELGVEL GGEFRAAYQY WQAQQSIPTG TSSQSCALIL GDRPLQLTLV RAWESLGFWP 
KVKVLLGLLW SSWQKPKKEE IQEWLQSVLR DETDVLTESL KELRRHFPTL FTVIIAERDA 
WLAAKLVQSC RVLSASATAA SPVCTVVAIV GAGHIPGIVA WLTTPPADTS ITPETVLRDL 
VTTKRWAHDD AIQLQAIPAW IYEVSHLQPS AS