Gene OSTLU_41017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41017
Symbol	ARP3502
ID	5002492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	-
Start bp	407678
End bp	408754
Gene Length	1077 bp
Protein Length	358 aa
Translation table
GC content	64%
IMG OID	640417913
Product	predicted protein
Protein accession	XP_001418472
Protein GI	145348055
COG category	[Z] Cytoskeleton
COG ID	[COG5277] Actin and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.000637788
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.733987
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCG ACGCGCCGGT GACGGTGCTG GACGTCGTGG ACGGCGATCT GCGGGGCGGG 
TACGCGCTGG ACGGCGTCGC GCGCGCGCCG AGCGCGACGC GACGCGGTCG AGTGCGCGCG 
AAAAGCGCTG GACGCGGGAA CGGAAGCGAC GACGGCGCGT TCGACGCGAT CGCGCGGTCG 
CGCGTCGAAG ACGTGGACGC GTACGAGTGC GTCGTGCGCG CGATGACGTA CGGCGACCTG 
GGATGGGAGC GAGGGAGCGA GGGGATGGTG GTGGCGTGCG AGGCGAGCGG GACGTCGAAC 
AGGACGCGCG AGCGAACGGC GAGGATGTTC TTTGAAGAGT TCAACGTCGG AGGGTTGGCG 
TTTTTAGATA AGGCGGTGTG CGCGATGTAT GCGTGTGGAC GCGCGAGCGG AGTGGCGATC 
GATGTGGGAG AGCAAGGGGT GGAGTGCGCG TGCGTGGTGG AGGGGGCGAC GGCGCACTCG 
ACGACGAGGC GGAACGACGA CGCGGGAGGA CGAGCGATGG ATCGCGCGCT GGTGCAGGCG 
GTGAGGAAGA AACAAGGGAT TGCGTTAGAT TTGACGACGG CGAGTGATAT TCGTCGGAAG 
TTGGGGAAAT GTGCGGCGAC GCGGGAGGAG TACGAGGCGT TGGCGCGAGG GTGCGCCACC 
GTGGAGTGCG AGCAAGAGAC ATTCGCCATG CCGGATGGAA GCGCGCTAAA GCTGACGAAC 
GAATTGTACG AGTGTGGAGA GGCGGTGATG CCGATCGTGG ACGACGTGTG CGAGTGCGTG 
CAAAAGTGCT CGTCAGAATT GAGACGGTTC GTGTTGGACA GCGTCTTCGT GCACGGCGTG 
GCCAGCAAAG TCTCTGGGCT TGATGCTCGC TTGTTTCACG AGCTCACGTC GAGTTTGCCG 
CCCTCGTTGA CGCCAACGAT GGTAAACATT CCGGAGTACA TGCCAGAAAC CACGTGGTCG 
CACGCGCCTT GGACGGGCGC CGCGATGGCG GCGAAAACCA TCTTCGCTTC GAACCAGTAC 
ATTTCGAAGA GCGATTATAC CGATAACGGA CCACCGATCG CGCATCGCGG GCGTTAG

Protein sequence

MASDAPVTVL DVVDGDLRGG YALDGVARAP SATRRGRVRA KSAGRGNGSD DGAFDAIARS 
RVEDVDAYEC VVRAMTYGDL GWERGSEGMV VACEASGTSN RTRERTARMF FEEFNVGGLA 
FLDKAVCAMY ACGRASGVAI DVGEQGVECA CVVEGATAHS TTRRNDDAGG RAMDRALVQA 
VRKKQGIALD LTTASDIRRK LGKCAATREE YEALARGCAT VECEQETFAM PDGSALKLTN 
ELYECGEAVM PIVDDVCECV QKCSSELRRF VLDSVFVHGV ASKVSGLDAR LFHELTSSLP 
PSLTPTMVNI PEYMPETTWS HAPWTGAAMA AKTIFASNQY ISKSDYTDNG PPIAHRGR