Gene OSTLU_33570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33570
Symbol
ID	5003809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	433607
End bp	434960
Gene Length	1354 bp
Protein Length	424 aa
Translation table
GC content	61%
IMG OID	640419230
Product	predicted protein
Protein accession	XP_001419807
Protein GI	145350846
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.104047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.023306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCTCG CGTCGGTCGT CGAGGCGACG CTCGGACGCG TCGCCGCGCT CGGACGCACG 
GCCTCGAGCG CGTCGACGTC CGCGAGCGGC GTCGCGGACG CCGGCGCGGC GACGCTGCGG 
CGACTCGGCG CGGCGAAGAC GCGCGGGACG TCGTCGCTCG ATGACTTGAA CGAACACGCG 
AAAATCATCA CCGACGGCGT CGATTTCCGG CCGGTGACGG ACACGTCGTG CTTCGTCGAC 
GCGTATCGCT CGAGCGACGC GGCGACGGCG GTGATGTTCG TCTTCATCAG CGGGTGCGTG 
CTCGGGGCGG TGCCGCAGTA CCTGAAGGTG GTGGTGTTGG GGACTTCGGA GGGGCTGTCG 
CTGAGCTCGT TGGCGCTGAT GAACGTGTCG AACGTGTGCG CGACGATGAA TGTGTTCATT 
CTGCATTACG AGCAGATCCG ACGGTGCGTC GCGGGAGCGG CGGGGTACGA GTACGAGCGG 
TGTCAGGCGT CGCTGTTGAC GCTGTATTAC ACGTTGATTT ACACGTTGCT GTGGATACCG 
CTCTACCCGC TCGCGGCGCA CTTCACGAGC GATCGCAAGA CGGAATACTT TGGGTACGTC 
ATGTCTAAGC GTAAGGCGGC GTGGTACGGG TTAGCGTTGT GGGCGGTGCC GTGCGCGTTG 
CTCGCGGCGC CCGTCGCGAG GATGTTGTTC GGATCGACGT GTTTTGAGTT TGAACGTTAT 
GCGATTTTCT TAGGGTTGAC GAACGCAGTT TTAGAAACCA CGCGATACGT GCCGCAGTTG 
TGGGAGTCCG TACACTCCAA AGGTTCGGGG GCGATGAGTT ACATGCGATT AGCGCTGTCC 
GTCGCGGGCG GGCTCGGGGC GACGATTCAA AAGGCGGTGA TGCACGAGTC TTGGTCCACG 
TGGGGGCCTC CGCTCATCGG GCACGGATTG GAGATGGCTA TCTTCTGCGT GAACCTATTC 
AACGACATGA CGCGCCGTCG CGAGCGCACG GACATGAGGA AAGAGGCTTT AGGATTAATG 
CGCGATTCGG ACGACGACTA CGAAGACAGC CGCGACGACA TGGAGACGGA CGCCCACGCG 
AAGCGCAAGG CTGCGATGTT AGAGTCAGCC GAATCCGCCG CGCGCACGGG ATCGCCCACG 
AAATCCGAAT CAGACGTGGA GGATTGGGTG CAAAATATCC CCACCGAGGG CGGTTTCAAG 
GCGAAGACGT CCTTCGTGTG GCATCGCGCG TGCACGGACA AGCACTTCTT CACGTCGTTG 
GTGCGATACC TCTAGATTTC CCTCGTTCGG CGCGCGCGCG TCGAGTGCTC AACCATTTAG 
TCATCGTCAA TATCAGTAGA TTCTCTAGCG ACTC

Protein sequence

MVLASVVEAT LGRVAALGRT ASSASTSASG VADAGAATLR RLGAAKTRGT SSLDDLNEHA 
KIITDGVDFR PVTDTSCFVD AYRSSDAATA VMFVFISGCV LGAVPQYLKV VVLGTSEGLS 
LSSLALMNVS NVCATMNVFI LHYEQIRRCV AGAAGYEYER CQASLLTLYY TLIYTLLWIP 
LYPLAAHFTS DRKTEYFGYV MSKRKAAWYG LALWAVPCAL LAAPVARMLF GSTCFEFERY 
AIFLGLTNAV LETTRYVPQL WESVHSKGSG AMSYMRLALS VAGGLGATIQ KAVMHESWST 
WGPPLIGHGL EMAIFCVNLF NDMTRRRERT DMRKEALGLM RDSDDDYEDS RDDMETDAHA 
KRKAAMLESA ESAARTGSPT KSESDVEDWV QNIPTEGGFK AKTSFVWHRA CTDKHFFTSL 
VRYL