Gene OSTLU_359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_359
Symbol
ID	5005444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	686103
End bp	688040
Gene Length	1938 bp
Protein Length	646 aa
Translation table
GC content	57%
IMG OID	640420865
Product	predicted protein
Protein accession	XP_001421534
Protein GI	145354526
COG category	[R] General function prediction only
COG ID	[COG3596] Predicted GTPase
TIGRFAM ID	[TIGR00993] chloroplast protein import component Toc86/159, G and M domains

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCAGATCCGA GCGACGAAGA TGCGACGAGG ACGTACGAGC TGCAAATGCT TCGCATCAAG 
CTCTTGCGCT TGGCTTCGAG ATTGGAACAA AGCCCGAGAA ATACGGTGGT GGCGCAGGTG 
ATCTACCGTC TGGAACTCGC AGAACAGCTC AAGGCTGGGA AAGGGACGCA GAAAGATCCG 
TCCAATTCGT CCTTTGATCG CGCCGTGGCG CTCGCCGAGC AAGCCGAGAA AGAGGGCTCC 
GACGCGGATT TGGATTTTAC GTGCACCATC TTGCTTTTGG GTAAGAGTGG CGTGGGTAAG 
TCCGCGGTGA TCAACTCTCT GTTGGGCGAA GGTTCGGCGC CGTCTGGTAC GGACGATGAG 
GACGCGACGA AGAAGGTGCA ACTGATTGAG AAGAAGATTC ACGGCATGAC GCTTCGACTC 
ATCGATACGC CTGGTTTGCA AGCGTCTGCG ACGGACATTC GTTACAACTC CACCATCATG 
AACGATGCGA AGAAGTTTAC CAAGCAACAC AAGCCCGACA TCGTGCTTTA CTTCGATCGT 
CTCGACATTC CGTCGCGATC GGACGCGGCG GATTTGCCGT TGTTGAAGCA AATCACGAAC 
ACCTTTGGCC AAGCGATTTG GTTCAACGCC ATCGTCGTCT TGACGCACGC CGCCGCCGCG 
CCGCCGGATG GCGCAAATGG CCAGCCGATT TCTTACGAAA TGTACGTCGC TCAGCGTTCG 
CACATCGTGC AGCAAACGAT TCGCCAAGCC GCGGGCGACA TGCGTCTCAT GAACCCAGTG 
GCGCTCGCGG AGAACCACCC GCTTTGCCGC ACCAACCGTG CGGGCGAGCG AGTGCTTCCG 
AACGGACAAG TTTGGAAGCC GCAGTTGTTG TTGTTGTGCT TCGCGTCCAA GATCCTCACG 
GAGGCGAATA CGTTGTTGAA CTTGGCCGCC GACCAACAAA AGGCTGCCAA GGCGGCGCGC 
GCGGGTGGCA TGCCGGGGCA ACAAAAGGTG CCCCCGCTTC CGTTCTTGTT ATCTTCACTC 
ATCACCACTC GAAAGCCTCG TCGTTTGGTG GAGTATGAAG ACGATGGATT CGAAGATTTG 
GAGAACGAAA TCATCTCTGG CGAGCCGTCC CCGTACGACA TTCCCGCGGA TCAGATGGAG 
CCGACGCCGA CGCCAAAGCA AGTCTCCATT CCGGCGCCCG ATCCTCAATT GCCCTTGTCT 
TTCGATGGCG ACACGCAAGG TCACCATTAC CGGCAACTTG AGTCGAACCA ACAGTGGTCG 
TGCCGACCGA TCGTGGACGC GCACGGCTGG GATCACGAGA CTGGCGTGGA GGGCTTCTCC 
GTCGAACATC AGTTTGTTCT CAAGGACCAA GTCCCAGGTG TGGTTCAAGC GCAAATTTCC 
AAGGACAAAA AGGACAGCAA CTTCGGTTTT GAAGGTGAAA TGTCTGTCCC GCACTCGCGA 
ACTCTGATTT CGACGACGGG CGTCGACATT CAAACCGTGG GCAAGGATTT GGTGTACACG 
GCGCGAGGGG AGACGAGGTG GAAGTTTTGC GCCGTCGACA AGATCATCGG TGGTCTTTCC 
GCCTCTTTTG TCGGTGGTGT GGTGGCTCTC GGTACAAAGA TCGAGAACCG ATTCAAGGCT 
CGTCCTGGAA TGAAGGTTGT CGTTAGCACG GGCGCTGTCA CGGCGCAAAA GGATGTTGCG 
TACGCAGGTA ACCTCGAGAC GATTATCCGT CACAGCGAGG ACCCGTCGAA CCCGAACTCA 
TCCACGCTCA GCGCGAGTTT CATGAACTGG CGCGGCGACC TCGCCCTCGG GTGCAATGGT 
ATGAGTTCTA TCCAAGTCGG CAAGGACACG CAAGTCACCA GTAGTTTCAA CATCAACTCG 
CGCGGCACGG GGAAAATCTC CGTCCGAGCG ACGACGAATC AACGCATGTC TCTCGGCAGC 
GTCGGCTTGA TTCCGATT

Protein sequence

PDPSDEDATR TYELQMLRIK LLRLASRLEQ SPRNTVVAQV IYRLELAEQL KAGKGTQKDP 
SNSSFDRAVA LAEQAEKEGS DADLDFTCTI LLLGKSGVGK SAVINSLLGE GSAPSGTDDE 
DATKKVQLIE KKIHGMTLRL IDTPGLQASA TDIRYNSTIM NDAKKFTKQH KPDIVLYFDR 
LDIPSRSDAA DLPLLKQITN TFGQAIWFNA IVVLTHAAAA PPDGANGQPI SYEMYVAQRS 
HIVQQTIRQA AGDMRLMNPV ALAENHPLCR TNRAGERVLP NGQVWKPQLL LLCFASKILT 
EANTLLNLAA DQQKAAKAAR AGGMPGQQKV PPLPFLLSSL ITTRKPRRLV EYEDDGFEDL 
ENEIISGEPS PYDIPADQME PTPTPKQVSI PAPDPQLPLS FDGDTQGHHY RQLESNQQWS 
CRPIVDAHGW DHETGVEGFS VEHQFVLKDQ VPGVVQAQIS KDKKDSNFGF EGEMSVPHSR 
TLISTTGVDI QTVGKDLVYT ARGETRWKFC AVDKIIGGLS ASFVGGVVAL GTKIENRFKA 
RPGMKVVVST GAVTAQKDVA YAGNLETIIR HSEDPSNPNS STLSASFMNW RGDLALGCNG 
MSSIQVGKDT QVTSSFNINS RGTGKISVRA TTNQRMSLGS VGLIPI