Gene OSTLU_44053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_44053
Symbol
ID	5004449
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	+
Start bp	112783
End bp	114261
Gene Length	1479 bp
Protein Length	463 aa
Translation table
GC content	60%
IMG OID	640419870
Product	predicted protein
Protein accession	XP_001420250
Protein GI	145351799
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0440] Acetolactate synthase, small (regulatory) subunit
TIGRFAM ID	[TIGR00119] acetolactate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0143382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGCT CGAGCGCGAC GCGCGGGTCG GGCGACGATT ACGACCTCGA CGCGGGCATC 
GCGGGCGCGA CGCCGGGCGA TGGATGGACG CCGACGTCGT ACGACGGACG CGGGAGCACG 
GGGGACGTGT ACCAAGGGCC GGCGCGGCTG GCGGAGGGAT TGCGAAGACA CACCGTGCTG 
GTGTACGTCG CGGACGAGAC CGGGATGATC AATCGCGTCG CGGGGGTGTT CGCGCGACGA 
GGGTACAACA TCGAATCGCT CGCGGTGGGG CTGAACATCG ACAAGGCGAT TTTTACGATC 
TCGGTGATTT GCAGCGACGG CGACGTGGGG AAGCTGATCA AGCAGGTGAA TAAATTGGCC 
AAGGTGCGAA AGGTGGAGAA CGTCACGGAT AAGGAGTGCG TGGAACGAGG GTTGATGCTG 
CTGAAGGTGA AGTGCGAGCC CGAACAGCGG TCGCAGGTGC TGGAGATTAA TCGGATTTTC 
CGAGCGAGCG TGGTGGACGT GGCGGAGCGG TCGCTGACGA TGTCGGTGGT GGGGGATCCC 
GGGAAGAATC GAGCGTTTCA GAGCGCGCTG ATGAAGTTCG GGGTGATTCA AGTCGCGCGA 
ACGGGGAAGT TGGCGCTGAA GAGAGAGCCC GTGTACAGCG AGGCTCGGTC TCGTCGAGTG 
AAACTCATGG AGGCGATGCG AAAGGCGAAG GACGCGGTGA GCGGATTAAA CATCAAGGAG 
AAGAGCGCCA AGTACGAGAG CATCTTGGCG TCACGAATCG TTCGCGCGGT CGCGGGGATG 
GAACACGACG ATGACGGCGA CTTGCACGTC GGCGACGTGT ACACGTCGCT CGAGAACGAC 
GAAATCGGAG TGTGGGACGT CCCCGTGCTC AGCTCTTCCT TCTCGGGACT GGGGCACGGT 
AGCGACAAAG TCGACATCGA CAAGATGGAC GAAAACGCCA AGTACACGCC GCACACTATC 
TCTATTTTGG TCGATAACCG CCCGGGCGTG TTGGATTCCA TCACCGGCGT GTTCGCTCGT 
CGCGGGTACA ACATTCAGTC CCTCGGCGTC GGCCCGGAAA GAACTTTCGA CATCTCTCGC 
ATTTCCACCG TCGTTCCGGG CAGTACCGAA GACATCGCGA TGCTGCTCAA GCAAATCTTA 
AAGGTGCCTT ACGTCATCTC CGCCGAAGAT ATCACGATGA CGCCGTTCAC GGAGCGCGAA 
CTCATGCTCA TCAAGGTCGT CAGCTCTCGC GCGCAACGAG CAGAAATTAT CGATTTGTGC 
GGCATGTTCC GAGCCAAGGT GTGCGACATC TCCGAAGACA CCGTCACCAT CGAAGTCAGC 
GGGCGCCAGC GTAAGATTAA CGCCATTCAA GCGCTTCTCG AGCCGTACGG GATTCTGGAA 
GTTGCGCGCA GCGGTCGCGT CGCGCTCCCG CGCGATTCGG GCGTCGATTC CAAGCTCATG 
ATGGCGATCG AGTCCGAAAG CGATCTCGAC AAGTGGTAA

Protein sequence

MTRSSATRGS GDDYDLDAGI AGATPGDGWT PTSYDGRGST GDVYQGPARL AEGLRRHTVL 
VYVADETGMI NRVAGVFARR GYNIESLAVG LNIDKAIFTI SVICSDGDVG KLIKQVNKLA 
KVRKVENVTD KECVERGLML LKVKCEPEQR SQVLEINRIF RASVVDVAER SLTMSVVGDP 
GKNRAFQSAL MKFGVIQVAR TGKLALKREP VYSEARSRRV KLMEAMRKAK DASAKYESIL 
ASRIVRAVAG MEHDDDGDLH VGDVYTSLEN DEIGVWDVPM DENAKYTPHT ISILVDNRPG 
VLDSITGVFA RRGYNIQSLG VGPERTFDIS RISTVVPGST EDIAMLLKQI LKVPYVISAE 
DITMTPFTER ELMLIKVVSS RAQRAEIIDL CGMFRAKVCD ISEDTVTIEV SGRQRKINAI 
QALLEPYGIL EVARSGRVAL PRDSGVDSKL MMAIESESDL DKW