Gene PHATRDRAFT_40135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40135
Symbol
ID	7195920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011690
Strand	-
Start bp	237208
End bp	238593
Gene Length	1386 bp
Protein Length	461 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002184209
Protein GI	219127994
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGCGG CTAGTCACTA CCGACGCACC AACTCTGATG CGAAGGTGAG ACTCGTCATA 
CTCTACCTCT TGATATGTCG GGTGGCTAGC TTTTCTGTCA AGAATACGGA GCAATCGTCG 
AGTTGCATTT CGCTGGATAA TCTTCAAAAT AAACGAGTGT TGGTAGTGGG TGGATCAGGC 
CGAGTCGGGG GCAGTTGTGT CACTCAACTA GTGCTCCGAG GCTCGCAAGT GACGGTCGGG 
GGGACCAACG CGGAGCGCTT CCTAAGCTCG CGAAAACGAT GGCAAAGTCT CTTTCCCGAC 
ATATGCGAGG ACCTGGAAGA AGTGGATTTT GTTGCTCTCA ATCGAGAGCG ATCAGAATCG 
GTCCAAGCAG TCCTGAGCGG ATATGATCTT GTCGTGCATA CAGCAGGACC TTTTCAGGGA 
AAAGTTAATA CGCCGAACGG AGTCATTGAA GCTTGCGTAG AGAATGGTGT GCCGTATATC 
GACGTGTGTG ACGACTACTG CACAGCATCG GCAATTAAAA CCAAGCTTGC GGAAAAGGCT 
AAAGAAAGCA AAACTCCATG CATCATTTCT ACTGGATGTT GGCCGGGAGT ATCCAGCCTC 
ATGGCAAAAC AACTTCTGCA AAAATCTATG CAAGCCTATC CTGATGTAGA CCAGAGAGAT 
ATATCGGTCA AGTTTTCCTT TTTCACCGCG GGATCTGGCG GGGCAGGTGT CACGTTATTG 
GTTGCTACCT TTCTAATTCT CGCTGAAAAA GCTTTGACGG TCGTCAATGG CCGTCGAAAA 
GTCGTAACTC CCATGGAAAC ATATTCAACC GTGCATTTTG GGCCTGTTGT TGGTGATAAA 
GAAGTGGCGC ACCTTAATTT GCTTGAAACA GCGTCGGTGG CCGATGTCTT GCGCATTGGC 
AACGTTCAGG CTCTCTTTGG TACCGCACCT AACTTTTGGA ATGGTCTACT TGGCCTGATG 
GCGAAACTAC CAACACAGCT ACTCGAAAAC GAGGACCTTA TGCGCAAGCT CTCCATGTTT 
TCTCTGCCTA TCGTGCGATT GGTGGATGCA TTTGCGGGTG CTACCAATGC TATGCGCTGC 
GATATCTCCA ACACAAAAAA TCCTGATTTG TTTCGATGCT CGGCAATTTA TGCCCATAAA 
AATCTGGAAC CTTGTGTTGG CGAATGCGTC ACAGCCTTCG CAGCTGCAGT TCTTTCTGGT 
GCTGTCCGGG ACGGGATCTG GTTTCCGGAA GAAGCAATTC AGGGTGGCGT CGATGCGGCT 
GCCGTCTTGG CGGCGGCATC TGTCGGTGCG CATACCGTTC TAGTCAGTTC CGAAGGAATG 
GAATTGAGTC TAGAACAAGT GTGGGGCACC AGAAGAAAAG AAACTATAAC AATGACGAGC 
ACGTAG

Protein sequence

MIAASHYRRT NSDAKVRLVI LYLLICRVAS FSVKNTEQSS SCISLDNLQN KRVLVVGGSG 
RVGGSCVTQL VLRGSQVTVG GTNAERFLSS RKRWQSLFPD ICEDLEEVDF VALNRERSES 
VQAVLSGYDL VVHTAGPFQG KVNTPNGVIE ACVENGVPYI DVCDDYCTAS AIKTKLAEKA 
KESKTPCIIS TGCWPGVSSL MAKQLLQKSM QAYPDVDQRD ISVKFSFFTA GSGGAGVTLL 
VATFLILAEK ALTVVNGRRK VVTPMETYST VHFGPVVGDK EVAHLNLLET ASVADVLRIG 
NVQALFGTAP NFWNGLLGLM AKLPTQLLEN EDLMRKLSMF SLPIVRLVDA FAGATNAMRC 
DISNTKNPDL FRCSAIYAHK NLEPCVGECV TAFAAAVLSG AVRDGIWFPE EAIQGGVDAA 
AVLAAASVGA HTVLVSSEGM ELSLEQVWGT RRKETITMTS T