Gene OSTLU_32817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_32817
Symbol
ID	5002803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	688824
End bp	689943
Gene Length	1120 bp
Protein Length	347 aa
Translation table
GC content	60%
IMG OID	640418224
Product	predicted protein
Protein accession	XP_001419015
Protein GI	145349174
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.37065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGCCGACG CGCGAGCGCG CGCGATGGGC AGGCGGATGA AACTGCTCGG GATCGAAGGC 
GGAGGGACGA CGTGGATCGC GCGCGCGATC GAGATCGACG TCGAGGGCGG TGCGAGCGTG 
AGCAGCGCGT CGAGCGCGCG AGGGGAGGAG CATTTCAACA AGAGGGACGG CGGGCGGGAA 
CAGAGGTTTG AGACGACGAC GCCGGAGGAG ACGCTGCGAA CGATACGAGA GTGGATCGAA 
ATCAACGCGT GGGACGCGGA TGCGATCGGG GTGGCGACTT TCGGGCCGTT GGAGCTGAAT 
CCAGATAAAG ACAAGTACGG ATACATCACG ACGACGCCGA AGGCGGGGTG GCAAGACGTC 
GACGTCTTGG GCAGTCTGTT CGGGAAAAAG GACGCGACGG AGGAGGAGGA AAGGGCGTGG 
CGAGGACGCG CTCGATTGCA CACGATCGAT CAGGTGCCTT TGGCGTTTGA AACGGACGTC 
AATGCGCCGG CGATGTTGGA ACATAGGGCG TTGAAACACG AGTTGAAACA CGTCCATCTC 
GTGGGCGGCG AGTCGTGTTG TTACGTCACC GTGGGTACGG GCGTCGGGGT TGGTGTGGTG 
TGCAATGGCT TACCAGTGCA CGGTATGCTA CATCCTGAGG CGGGTCACAT GTTCGTCAAG 
ATGAGAGCAG GGGAAACGTT TGCGGGAACG TGTCCGTTTC ATGGCAACTG CGTGGAAGGC 
ATGGTCGGAA GCGGAGCGTT GGCAAAACGA CGGGGCGTCT CAGCCGCCGA GCTCGCATCG 
CTTCCGGATG ACGATGACAT TTGGGAACAT GCCGCACATT ATCTTGCCGG CATGTGCGTC 
AATCTCATCT TAACCCTCGC CCCTGAGCGC ATCGTCCTCG GCGGTGGCGT CATGCAGCGC 
GAGTGCTTAT TCAGCAAGAT TCGTGCCAAC GTCCGAGACA TCTTGCAGGG CTACCTAGCC 
GTCGATCAAA TCATGGACGA TGCTTATTTA CGACACTTCA TCGTTCCTCC CGCGTGGGGC 
TATCAAACCG GTCTCACGAG CGCCCTGTAC TTAGCCGAGC GAGCGCTCCA ACGCGAGTGA 
TTCGTGTGTG GATATTTGTA AAAACACGAA GCCCCCACCT

Protein sequence

MKLLGIEGGG TTWIARAIEI DVEGGASVSS ASSARGEEHF NKRDGGREQR FETTTPEETL 
RTIREWIEIN AWDADAIGVA TFGPLELNPD KDKYGYITTT PKAGWQDVDV LGSLFGKKDA 
TEEEERAWRG RARLHTIDQV PLAFETDVNA PAMLEHRALK HELKHVHLVG GESCCYVTVG 
TGVGVGVVCN GLPVHGMLHP EAGHMFVKMR AGETFAGTCP FHGNCVEGMV GSGALAKRRG 
VSAAELASLP DDDDIWEHAA HYLAGMCVNL ILTLAPERIV LGGGVMQREC LFSKIRANVR 
DILQGYLAVD QIMDDAYLRH FIVPPAWGYQ TGLTSALYLA ERALQRE