Gene PHATRDRAFT_14962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_14962
Symbol
ID	7203619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011685
Strand	+
Start bp	481051
End bp	482253
Gene Length	1203 bp
Protein Length	400 aa
Translation table
GC content	50%
IMG OID
Product	cystathionine beta-lyase
Protein accession	XP_002182846
Protein GI	219125142
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACTT CTCTGGCACA CGCAGGTGTG GTTACTGGAA AGAATGCGGC CATGTCTCCT 
CCGTTGCACA TGGCAACAAC TTATACCAGG CCAGCCGATG GATCTTATCA AGAAGGAGAC 
TTGATTTACA CACGTATGGA CAACCCTACA AGAAATCTAC TTGAGGCGGA GACTGGCAGG 
CTTGAATGTC ACGGTCGAGC TGTGAACTCC GACACGCCAA TCATAAGTTG TGCATTTGCG 
TCGGGTATGA TGGCCGTGTC TTCGATCGTT CTCGCCCACC GGTTACCATT GAAGGTTTTG 
CTGCCAGTCG ATGCCTACCA TGGTGTTCCG ACTGTCCTTC GAGACGTCTT TTCGCGTTTC 
GATGTAGAAA TCCGTACTGT CGAAATGAGT GATCCAGCGG CCATCGAAGC TGACCTGGCA 
AAAATATCGG TAAAAGACGA TGTCATTGTA TGGATGGAGA GCCCTTCGAA CCCAAGAGTT 
GACATTATTG ACATTTCTTT AATAAGCAGC ATCGCAGAAA AATCGGGCCG TCGCGTCACT 
ACTGTGGTCG ATTCCACCCT CGCTCCTCCA ACGATTCAGC AGCCTCTCCA GCTTGGTGCG 
GATTTGGTTA TGCATTCGGC GACAAAGTAC CTCGGTGGAC ATTCAGATCT ACTCTGTGGT 
GTCGTGACAG CGTCTCCATG GACTAATCGT GGTCGTTTCA TTGGGCCACT TATACGGCAG 
GTGCAAGTCG CTGTCGGAGG TGTGGCCTCT CCACTGGATT CATGGCTCAC GCTGCGTGGT 
CTAAGAACCT TGGCTATCCG TAGCAGTCGC CAATGCGAAA CTGCTCTCCT TCTTGTCAAA 
TATCTACAGC ACCATCCATT GGTAGACAAG GTCTATTATC CTGGACTGGA AGAACACTTT 
GGCCACAAAA TTGCTAAACG TCAAATGAAG AATGGATTTG GAGGTGTTTT CAGTGTTGAA 
ATGATCGGCG AGAGCTATGC GTTTGCGTTT GCGGCGGCCC TGACAGTCGT TCAACGAGCT 
ACCAGCCTCG GCGGGACTGA AACTCTAATT GAACATCGGG CGAGTATAGA GCCACCTGGC 
CGCGTAGTTA GTCCACGGGG ACTACTGAGG GTCAGCGTAG GCCTGGAACA CGCATCTGAT 
ATTTTGTCTG ACTTTGAAAG CGCCATGGAC ATTGTTCAAA CGATTCATGG TATTCGTGGC 
TAA

Protein sequence

MATSLAHAGV VTGKNAAMSP PLHMATTYTR PADGSYQEGD LIYTRMDNPT RNLLEAETGR 
LECHGRAVNS DTPIISCAFA SGMMAVSSIV LAHRLPLKVL LPVDAYHGVP TVLRDVFSRF 
DVEIRTVEMS DPAAIEADLA KISVKDDVIV WMESPSNPRV DIIDISLISS IAEKSGRRVT 
TVVDSTLAPP TIQQPLQLGA DLVMHSATKY LGGHSDLLCG VVTASPWTNR GRFIGPLIRQ 
VQVAVGGVAS PLDSWLTLRG LRTLAIRSSR QCETALLLVK YLQHHPLVDK VYYPGLEEHF 
GHKIAKRQMK NGFGGVFSVE MIGESYAFAF AAALTVVQRA TSLGGTETLI EHRASIEPPG 
RVVSPRGLLR VSVGLEHASD ILSDFESAMD IVQTIHGIRG