Gene OSTLU_2530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_2530
Symbol
ID	5002654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	183185
End bp	184225
Gene Length	1041 bp
Protein Length	347 aa
Translation table
GC content	59%
IMG OID	640418075
Product	predicted protein
Protein accession	XP_001418861
Protein GI	145348860
COG category	[L] Replication, recombination and repair
COG ID	[COG5260] DNA polymerase sigma
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATCGACTTTT CGTACCTGGA CGCGGCGCCG ATACGGAACG AACCGGGAAG CGCGAGCGCG 
ACGGCGGTCA AGGCGCTCGC GGTGGAGGAG GAGGAAGCCG AGGAGGAGTA CTTCGATCCG 
AACGAGAATC CGCGATGGTG CCCGCCGGGA ACGGTGAAAC GTTTGAGGAA TTTACAGTCG 
CCTCTGATCA GGCTGCACAC CGAAATCGTG GATTTCAGTA GGTATTTAGA GCCCACCGAG 
GAGGAAGCGA CGTCGCGCGC CGCCGCCGTC GAACGCGTGC GAGCGGTGGT GAACGGGATC 
TGGCCCGACG CTCGATTCGA AGTTCACGGT TCGTTTGCGA CCGGCATGTA CTTGCCGAGC 
TCGGACATCG ATGCCGTGAT CTTGGACAGT GGTGCAAAAA ATGCGGGTCT GTGTTTGAAG 
GCGCTCGCCG TCGCCTTGGC GCGACGCGGC ATGGCGATCA AGATACAACT CATAGCCAAG 
GCGCGCGTGC CCATCGTGAA ATTCGAAGAA GTGGAAAGCG GACATCAGTT TGACATTAGT 
TTCGACGTCG CGAACGGGCC GGCGAGCGCG GAGATCGTTC GAGAAAACAT GCGAAGGTTT 
CCCGCGTTGC GTCCGCTCAC CACGGTGTTG AAGGCGTTTC TTCATCAACG CGGGCTCAAC 
GAGGTGTATT CCGGTGGCAT CGGCTCTTAC GCGCTGCTTT GCATGGTGAT GGCTCATTTG 
CAGTTGCACA ACACGACGTG TAAATCGACG TGGGCGGGGT CGCACGGCGC GAGCGATGCT 
AGCGAAGGCT GCCTAGGAAC GCTCCTCATC GACTTTTTTG AGCTCTTCGG TCGCAGGCTC 
GTCGCGGAAG AGGTTGGGAT CTCATGCGGA GGCAAAGGTC CAGGCTTTTT TAAGAAACGC 
GACAAGGGCA TGTACGAAGA CTCTCGGCCG TTCTTGTGGG CGATCGAAGA CCCACAAGAC 
GAAACGAATG ATCTCGGTAG GAACTCGTAC GCGTGCAGGC AGGTGAAGAG CGCGTTTGAG 
CACGCGTTCA CCGTCATCAC G

Protein sequence

IDFSYLDAAP IRNEPGSASA TAVKALAVEE EEAEEEYFDP NENPRWCPPG TVKRLRNLQS 
PLIRLHTEIV DFSRYLEPTE EEATSRAAAV ERVRAVVNGI WPDARFEVHG SFATGMYLPS 
SDIDAVILDS GAKNAGLCLK ALAVALARRG MAIKIQLIAK ARVPIVKFEE VESGHQFDIS 
FDVANGPASA EIVRENMRRF PALRPLTTVL KAFLHQRGLN EVYSGGIGSY ALLCMVMAHL 
QLHNTTCKST WAGSHGASDA SEGCLGTLLI DFFELFGRRL VAEEVGISCG GKGPGFFKKR 
DKGMYEDSRP FLWAIEDPQD ETNDLGRNSY ACRQVKSAFE HAFTVIT