Gene PHATRDRAFT_37723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_37723
Symbol
ID	7202599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	-
Start bp	788425
End bp	789837
Gene Length	1413 bp
Protein Length	470 aa
Translation table
GC content	60%
IMG OID
Product	predicted protein
Protein accession	XP_002181804
Protein GI	219122961
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTGG CGGCCATTCC CGTCCAGCGC GCTTCCAGTA CGCATCTACC GCAGTGGCAG 
CGGTTCCAGC CGGAGCGTAC GGCATCGGAG CATCCCACCG GTACGCATCC CTACCAGCGA 
CAGTATGCAC ACGTCTACCA CCAGCGCTTG GCTGTCCTCG GACCCCGCGT CTGGCAAGCG 
GTCCTTCGAG ACAACCAGTG CGAGAACGAC AACCACAACC ACAGTAACAA TAACGACGAT 
GCCCACACGG TTCGGCACGT CCCACGGATT CTCGAACTAG AAGAAGGCGT CTTATCGATT 
GCCGTTGGAA CCATTGTTAA GGAATACGAA AACAGTGTCA CCGGTAACGA CATCAACAGC 
GACGCTGTCG TTCCGGGCGC CGTCAACGGT GCCAAAGACG CTCTGGTCCT CGAAGACGAA 
AGTGGACGCG TGGTGCTCGC TACCGCACTA GTACACCAGT ATCCGACCGG AGTCGTCCTG 
GGGGTCCAAG GAACTGTCGG CACGGACGGA GTTTTGCAAG TCGAACGCTT CTACCATCCC 
TGGACATGTG CACCACCCGC CTTGCCTTTG TATATCGACC ACACCAACAA TATCAACAAC 
AACAACAACG ACCCTACCTA TATCATGCTC GTTTCGGGAT TGCACTGCGG CAGCCCCAAA 
GTCTCGTCGC TACCCCGCGA CATGCTCCTC TCCTACCTAC AGGGTCGTTT CGGACACAAG 
GCCCGTCACG TCGCCCGCGT CATTTTCGCC GGTGGTCTCA CCTCCACCGA CGCCACCGCC 
GTACAGGAAC TCGACGGATT CCTACTCGCC CTCGCCGCAT CGGGTGTCCC TATTGACGTC 
CTACCCGGTG AACACGACCC GACCACCGCC AATTGGCCCC AACGGAGTCT GCACCGGGCC 
TTGCTCCCAC ACACCACCAC CCGCTACGGA ACACTCGTCG CGCGAACCCC CAACCCCTAC 
GCCGCTCGAC ACGATCACGT CGTTTGCCTC GGAACGGACG GACGCAACGT GCGGGACTTG 
TGTACCCGCG TGGGAGTTCC CGTCGATGAC CACGACTCGC CCGGAGCGTG GCGGCCCGTG 
ACGGAACTCC AAGCGCTCGA ACGTACCCTC GCCTGGGGAC ACGTCTGTCC CACCGGTCCG 
GACTCGGTTC CCACCGTCCC CCACGCTCTG CAAGATCCCA TGGTCATTGA ACCCCACTTA 
CCGCATCTCT ACTTTGCCGG TAACGCCAAA AAGTTCGCCA CCCAACGTGT TGTTGCCGCG 
CACGCGGATA CTGCTACTGC TGTGGACACC GACGATCGTG TCGCGTTCAC CCGACTCGTC 
TGTGTTCCCC AGTTTAGTGA AACCGGACAG GCGGTACTCG TGAATCTGCA AACCCTGGAC 
GTGGAAGTCG TGCGTTTTCA GGATGAAGAA TAG

Protein sequence

MTVAAIPVQR ASSTHLPQWQ RFQPERTASE HPTGTHPYQR QYAHVYHQRL AVLGPRVWQA 
VLRDNQCEND NHNHSNNNDD AHTVRHVPRI LELEEGVLSI AVGTIVKEYE NSVTGNDINS 
DAVVPGAVNG AKDALVLEDE SGRVVLATAL VHQYPTGVVL GVQGTVGTDG VLQVERFYHP 
WTCAPPALPL YIDHTNNINN NNNDPTYIML VSGLHCGSPK VSSLPRDMLL SYLQGRFGHK 
ARHVARVIFA GGLTSTDATA VQELDGFLLA LAASGVPIDV LPGEHDPTTA NWPQRSLHRA 
LLPHTTTRYG TLVARTPNPY AARHDHVVCL GTDGRNVRDL CTRVGVPVDD HDSPGAWRPV 
TELQALERTL AWGHVCPTGP DSVPTVPHAL QDPMVIEPHL PHLYFAGNAK KFATQRVVAA 
HADTATAVDT DDRVAFTRLV CVPQFSETGQ AVLVNLQTLD VEVVRFQDEE