Gene OSTLU_38141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38141
Symbol
ID	5004228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	+
Start bp	28190
End bp	29311
Gene Length	1122 bp
Protein Length	373 aa
Translation table
GC content	49%
IMG OID	640419649
Product	predicted protein
Protein accession	XP_001419879
Protein GI	145351005
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAATA TACTCAAAGC GTTGGACGCG AATCCGAAAT TAAAGGAGGA TTACGTGAGC 
GAATCGACGT CTGGGGTGAT CACTACTTTG GTGTGCGCGG CGTTGTGTTT GATTTTGTTC 
TTTGGCGAAT TCTTCTCGTA CAAGACGACG AAAATCGTGA GCGAATTGAG AGTAAATCCG 
CTCGGTGTTC ATCAAACGGT GCCCAACGCG GAAAGACTGA AGATTGACGT CGATATTACC 
TTTCACAGTC TGGCTTGCAA TCTCATCACG CTCGACACCT CGGATAAAGC CGGAGAAGAG 
CACTACGACG TGCACGATGG TCACATCGAA AAGAGGAGGA TAGACAAGCA TGGGAAAGTG 
ATTGATGCTG CGTTTACTTC AGAAAAGCCA AACAAACACA AGGAGATTGA GCAAGCGCTG 
CAAAAGATGA ACGAGACCGA CTCCGCACAC GCCGCCGACT CTCATGCCAT GGAGCACGTG 
CAGCCGTTCG GTGGTATGTT TGGTCTACAA AGTTTATTGC AAGAAGTGTT TCCAGAGGGC 
GTGGAGCATG CGTTTAGAAA CGAGAATCAA GAAGGGTGCG AGGTGAAGGG TTACCTTGAA 
GTGAATCGGG TACCGGGACG GTTTTCCATT TCGCCGGGAC GTTCGCTCAT GATGGGGATG 
CAAATGGTCA AGCTAAACGT GCAGACGGCA TTAAATTTAA CGCATACGAT TCACAGGCTG 
TCATTTGGGG AAAGCTTTCC CGGTTTGGTG AGTCCACTCG ACGGAACGCA CCGCTCACTT 
CCGCCGAACG CGGTGCAGCA ATATTTTCTT AACGTTGTGT CGACGACATT CGAGCCTTTG 
GGAGAGAACA AAATCATCAG CACTCATCAG TATAGCGTTA CTGAAACTTT CACAAGCTCA 
CAGCGATCAA TTATGGGGAC GTCCAACGGC CGTGATCCGG GCGTCATCTT TACTTACGAA 
ATATCGCCGA TTCGCGTCGA CTTCAAAGAG ACTCGCACGT CGTTTGGTGC ATTCGTCCTG 
GGTATCTGTT CCGTCATCGG AGGCGTCGTC ACTATGGCGG GTATCACGCA AAATGCCGTT 
GAGTATATTA TTTCTAATCG CAAGACCCTC TTCGCGTCAT AG

Protein sequence

MTNILKALDA NPKLKEDYVS ESTSGVITTL VCAALCLILF FGEFFSYKTT KIVSELRVNP 
LGVHQTVPNA ERLKIDVDIT FHSLACNLIT LDTSDKAGEE HYDVHDGHIE KRRIDKHGKV 
IDAAFTSEKP NKHKEIEQAL QKMNETDSAH AADSHAMEHV QPFGGMFGLQ SLLQEVFPEG 
VEHAFRNENQ EGCEVKGYLE VNRVPGRFSI SPGRSLMMGM QMVKLNVQTA LNLTHTIHRL 
SFGESFPGLV SPLDGTHRSL PPNAVQQYFL NVVSTTFEPL GENKIISTHQ YSVTETFTSS 
QRSIMGTSNG RDPGVIFTYE ISPIRVDFKE TRTSFGAFVL GICSVIGGVV TMAGITQNAV 
EYIISNRKTL FAS