Gene OSTLU_19236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_19236
Symbol
ID	5006977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009375
Strand	-
Start bp	196138
End bp	197259
Gene Length	1122 bp
Protein Length	373 aa
Translation table
GC content	64%
IMG OID	640422398
Product	predicted protein
Protein accession	XP_001422919
Protein GI	145357424
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	0.906456
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.171238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGCG ACGCGCCGAA GAGCGCGATC CCGGCGATGT GCGCGCACGT CGCGTTCGGC 
GTGTGTTACT TTCTCACGGC GCAGCGCGTG TTGGACGCGC GATTGGTGTC GCCGGAGGCG 
CAGCCGTTGA CGGGCATGAT TTACGCGAGC GACGCCGCGA GCGCGAGCGC GGGCGTCCTG 
ATGGCGCGAT TACGCGCGAG AAGAGACGGG CGAGTGACGG CGACGGCGAG GCGCGCGGGA 
AAGTTCCCGC GCGCGGCGCT GTTGCTGCCG GTGTTTGATT TGTTTGGGCT GACGTGCGCG 
TTCGAGGCGA TGCGAGCGCT CGGGGGACCG CTGTACCAAA CCATCTCTGG GTTGCTCATT 
CCGCTCTCGG CGTTGCTGTC GAAGGTGGTG CTGAAACGCA CGTTCACTAA GGGGCAGATT 
GGGGCGATCG CGGTGGTGAT TTGTGGGCTG GCGGTGAAGG CGAAGGACGT GGCGGACGAG 
GCGGCGAGGC GCGGGACGGC GATCGACGCG AGGGGGATCT TGATCGCGAA CGCGGCGACG 
GTGAGTTATG GGTTTCGGGG ATTGGTCATG GAATACCTGA GCGCGTCGAA ATCGAGTCTG 
AGCGGGAACG CGCAGACGAT GCTGATGGGA ACGTGCGGGT TGGCGGCGTT TGCGATTTAC 
ACGCTCGCGA GGACGGCGCG CGATATGGAC GGGATGGTAT GGGCGTATTA CAACGCCTCG 
CCGCGAGATG TGTCATCGAT TTTAAAGGTG CACCTAGGAA ACATGCTCAG TCGGGCGTTC 
ATGGTGAAGA TGATGATGGC TGTCGTCGCC AGAGCGGGCG CCACGCAGTT GGCGCTCTCG 
AACGCGATTC GCAGCGTCGG CGTCATCGCG TTTTCGCACG TCTTATTTTG CTCGGACGAC 
GCGAGACAGT GTTTGAGTTA CAATGGCGCC ATCAGCGCCG TCATGGTTGT CACCGGCGGT 
CTCGCGTACG CGATGAGTGG GAAGCCGAAA ACCGCCGCCG CCGCCGCGCC CAAAACGGCT 
CGCGCGAGAA AAACCACAGT CGCCGTCGCG CGCGCCGACG CAAAACCGAC AGCGTCACCC 
TCTTCGACCG TCCGTCGCCG CTCCGCGCGT CGAGGATCGT GA

Protein sequence

MARDAPKSAI PAMCAHVAFG VCYFLTAQRV LDARLVSPEA QPLTGMIYAS DAASASAGVL 
MARLRARRDG RVTATARRAG KFPRAALLLP VFDLFGLTCA FEAMRALGGP LYQTISGLLI 
PLSALLSKVV LKRTFTKGQI GAIAVVICGL AVKAKDVADE AARRGTAIDA RGILIANAAT 
VSYGFRGLVM EYLSASKSSL SGNAQTMLMG TCGLAAFAIY TLARTARDMD GMVWAYYNAS 
PRDVSSILKV HLGNMLSRAF MVKMMMAVVA RAGATQLALS NAIRSVGVIA FSHVLFCSDD 
ARQCLSYNGA ISAVMVVTGG LAYAMSGKPK TAAAAAPKTA RARKTTVAVA RADAKPTASP 
SSTVRRRSAR RGS