Gene OSTLU_33434 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33434
Symbol
ID	5003675
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	197952
End bp	199724
Gene Length	1773 bp
Protein Length	440 aa
Translation table
GC content	60%
IMG OID	640419096
Product	predicted protein
Protein accession	XP_001419738
Protein GI	145350701
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00944369
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCGTCGCGAT GCCCGCGTGC GCGGCGTGTC GCGCGCGCGA CGCCGATATA TTTTGTCTCG 
CCGACGGTGC GCGCGCGCGA CGAGAGACGC GTCGCGAACG CGCGAAAAAG ACGCGGATGG 
ACGCGCGCGC GGCGACACGA TGCGCGCTGA CGCGGATGGA CGACGACGAC GAGAGACGAG 
AGACGAGAGA CGCGCGACGC GCGCGACGAG AGACGCGCGC GACGAGGATT GGGACTGATT 
TTTTACGCCC GCGATCGCGC TTCGATTCGG CGCAGAGGCG TTCCTGTGCG CGACGTGCGA 
CGCGCGCGTG CACGGGGCGA ACGCGGTGCG CGCGCGCGCG GATATTCGCG AAACGAACGC 
GCGCGCGAAC GAGCGATGTC GACTGGGCGC GCGAGACGAC GACGCGACGG ACTGACGATC 
GGGACGCGGT TGAACGCCGT AGGTCGCGGC GAGACACGAG AGGATCACGG TGGATGAGTG 
GTATAAACGA ACGCTCGAGG CGGGATTGAG TGAGGCGAAG GAGTGCGGGG ATTGGAAAGC 
GGCGGCGAGC GCGACGGCGA GCGCGAGGCG CGAGGACGAG GACGGACGAG GACGCGGGAC 
GAGCGAGAGT TTGAGGGAGA AGAGTTTCAG TTTGTTTAAG AGGGACGATG CGAAGACGAC 
GACGCACGAT TCGACGTCGA GCATGGACGC GACGATCAGT GCGTGGGATG TGGGCGTGTT 
TTTGAATTTA GGTGAGAACG GAGAAGAGGA TACGAGTCCA AGGGCGCCGC GAATGTCGAG 
TAATAGCGAC ACGATGATTT TCGATTTGGA CGACGATCCG TTGGCTTCTT TGCTGGAGAT 
GCCCGAAACA GAGTCGGCGC TTTTATTCGA TGGCGATGCG GCGTCTATTT CCGCCGCTCT 
GGAGGCGGTG GCGGATCAGA TTCAAGCGGT GAGCCCGAAT CAAGCCGCCG CCAAGGCGTA 
CGTCTCGAAG AGCGCGAGAG ATAATTTCAC TCCGCGACCG TCGCCTCTTG GATTGGGACT 
GCCCGCGGCG CAGCGTGGGC CCGCAGAGAC GGTAGGTTCC TATCCACCCG GGGCTTTTCC 
ACCCATAATG ATGCCGATGT CGAGCGATCT CTTCGGCATC CCTCGACGCG TGGTGAGCAA 
GGAGCGCCAA GCGCAGCTCG ACAGATATCG CGCCAAGCGC GAGCGTCGAT TGATGGGGTT 
GAAGAAAGTG GTGCGCTATG AATGCCGTAA AACGCTCGCA GACGCGCGCG TTCGCGTGAA 
GGGTCGTTTC GTTAAGGCTA ATCCGGATGA GAAGACTTCA GCGCTAAAGT CATTTCAAAG 
CTGTCCAGAC TTGTCGGCGT TGGTTGAGGA TGAGGACAAC GCAAAGCCCC TATCTTTCGC 
ACCGATGAAG CACACAACGC TCGACGATCA GCAGCTACAT CAACAAAACT CTAAACGGCG 
CATCTCAGAT GATCGTTTGT CGAACTCTGA CGCGTCGCAT GACGATAAGT TGGATGTTCA 
GTCGATGCGA TACGAGATTC TTCGCGACTC GGGCGCGCCG GCGCTGCATC CACCCACGAT 
CCCAGAGACC TTACCTCTCC CCAGTGGCTT AAGACGCACG AAGCAGATGC GTCACTGCCA 
AAGCGAAATT AATTTGATGG ACTTGGCTGG CTATTAGCAA GTGTACACCG GTGTAGTCAA 
CTACGAGAAG CGCCGCTCAG CGCCGACGGC GCGCCATCCG CGGTAATATC GAGACTTCGT 
ATTTATGAAT ATATATTGTA CATTCTGTAT CAT

Protein sequence

MPACAACRAR DADIFCLADE AFLCATCDAR VHGANAVAAR HERITVDEWY KRTLEAGLSE 
AKECGDWKAA ASATASARRE DEDGRGRGTS ESLREKSFSL FKRDDAKTTT HDSTSSMDAT 
ISAWDVGVFL NLGENGEEDT SPRAPRMSSN SDTMIFDLDD DPLASLLEMP ETESALLFDG 
DAASISAALE AVADQIQAVS PNQAAAKAYV SKSARDNFTP RPSPLGLGLP AAQRGPAETV 
GSYPPGAFPP IMMPMSSDLF GIPRRVVSKE RQAQLDRYRA KRERRLMGLK KVVRYECRKT 
LADARVRVKG RFVKANPDEK TSALKSFQSC PDLSALVEDE DNAKPLSFAP MKHTTLDDQQ 
LHQQNSKRRI SDDRLSNSDA SHDDKLDVQS MRYEILRDSG APALHPPTIP ETLPLPSGLR 
RTKQMRHCQS EINLMDLAGY