Gene OSTLU_49779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_49779
Symbol
ID	5002487
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	-
Start bp	586784
End bp	589974
Gene Length	3191 bp
Protein Length	918 aa
Translation table
GC content	56%
IMG OID	640417908
Product	predicted protein
Protein accession	XP_001418525
Protein GI	145348163
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0653] Preprotein translocase subunit SecA (ATPase, RNA helicase)
TIGRFAM ID	[TIGR00963] preprotein translocase, SecA subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.894811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0907147
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGTCG CACGCGACCG CGCCTGGCGA GACGGCGACG CTAGGCAAAT CGCAGAACTG 
CAGACGCGCG TCGTCGATGC GGTTAGAGCG CTGGATCGTG ACGTGCGGAG TCTCACAAAT 
GATGAACTGC GCGGGAAGAC GGACGCGTTT CGCGCGCGGC TGCGAGCTGG GGAGACGTTG 
GACGATATTT TAGTGGAGGC GTTCGCGGTG GTGCGAGAGG CGTCGACGCG CGAGCTCGGG 
TTGACACATT TCGACGTGCA ATTGATCGGG GGGGCGCTTT TGCACGAGGG ATGGGTGGCG 
GAGATGAGTA CAGGGGAGGG AAAGACTTTG GTGGCGACTT TACCCGCGTA TTTGAATGCG 
TTGGATGGCA AGGGCGTGCA CGTGGTGACG GTGAACGATT ACTTGGCAGC GCGCGACGCG 
ACGGAGATGG GAAGGATATA TCGTTTCTTA GGACTCACGG TGGGCGTGAT TCAATCTGAC 
ATGACTTCAG AGGAGCGGCA GCGGGCGTAC GCGTGTGACA TCACGTATGT GACAAACACG 
GAGATTGGGT TCGATTACTT GCGCGACAAC ATGGCAAACG ACGCGGAAGA ATTGGTCGTG 
TTGACGCGTC CGTTCAATTT CGCCATCGTG GACGAGGTCG ACAGCGTCTT AATCGATGAA 
GGACGCAATC CGCTATTGAT CACTGGCACG GGCGACGTGA ACGACGACGA TCAGTACGTG 
ACCGCGGCTA AAGTTGCGGA AAGCTTAATC CCCGGGCGCG ACTTCAAAGT CGTCTTGAAG 
GAGAAAACAG CCGAACTCAC CGACGAAGGC ATGTTGCACG CGGAGCAGAT CCTCGGTGTG 
AACGATCTGT GGGATGCAAA AAACCCTTGG GGCAAGTACA TTCTGCTCGC CGTCAAGGCA 
AGGGCGCTCT TTATCAAGGA CATCGATTAC ATTGTGCGAG ACGGCAAAGT CATCATCGTC 
GATCCGTCCA CCGGGCGAGT GCAGATGAAT CGGCGATGGA ATGATAACTT GCATCAAGCC 
GTCGAAGCGA AGGAAGGCGT AGAAATTAAT GGCGAGAATT CAATCATCGC ATCCATTTCT 
TACCAATGTC TATTCAAGCT ATACAAGAAA CTGAGCGGCA TGACGGGCAC GGCGTCGACG 
GAATCGGAAG AGTTCTTCAC CACGTACAAT CTCGGCGTGG CGCGCGTGCC GACGAACAAG 
CCCAATTTAC GAATAGATAG CCAGACATCG CTCTTCTTAA ACAGCATACC GAGATGGTAC 
GCCGTCGTGG ATTTGATTGA GAGGTGTCAT GCCGAAGGCA GACCCGTACT CGTGGGTACG 
ACGTCGGTGG AAAATTCCGA AATTTTGAGT GACTTGCTCT CGCGGCATCG ATGGGTGACG 
AACGATGGGC GCAAAATTGC TGGCGTACCA CACGAGCTGC TAAACGCGCG TCCGCAGTAT 
GCGGCGAGAG AAGCCGAGAT CATCGCACAG GCTGGGAGAA AGTACGCGGT GACAATCGCC 
ACAAATATGG CTGGGCGCGG TACCGACATT CTACTCGGTG GTAGCCCTGT GGGCTTGGCG 
AAGCGTGCGT TGAAGGAGAA ACTTTGGCCC GCTTTTGATC TAGGGGATAT CGGTGACGCA 
GCTCTGCTCA TGTACGTTGA TCTGTCCCAA GAGGCCCAAA TCACGCTCAA TCAGGCGGAG 
CATGTGGCGA CGCAATCCAC TGCCTCGGCG GGATCGCTAA GCGAAGAACA AGCTGAAGAA 
TTGTTGGTAG AAGCGTTGGT CAAGGCAGAG GAACTGCTAC GTCGAGGGGA GAAGCCGGGT 
GCATGGGATA AGGATCGAGT GTTGATGCAT TTCGTCAACG TTGCCGCGTA CCACGTCTTG 
CGAGATTGCC AAAAGCAGTG CTCCGACGAA CGAGAAGAAG TTCGAGAAGT CGGCGGATTG 
CAAGTCATCG GTACCTCCAT TCACGACAGT CGACGCGTTG ATAACCAACT CCGCGGTCGC 
GCCGCACGTC AGGGTGATCC GGGAAGTACG GTTTTCTGTG TGTCGGCCGA AGACGAGTTG 
TTACAAACGT ACATGCCTGG TTGGGGAAAC GATAAGTTGT GGATGTTCGC CGGCGTCGAT 
GAGTACTCGC CCATCGTCTC GGATATCGTC GACGGTCAGC TTCGCATGGT TCAAAAGCAA 
ATCGAAGACT ACCTGTCATC GCACCGACAG TCCACGTTCG AATCCGATCG CGTGCTCGAT 
GGTCAGCGCG AGGCGGTGTA CAAGTTGCGG CGACAAATTC TGCTGAGCAG CCAGTCGGCG 
CTGCGTGAGC GCTTGTTCAA GTATATGGCC AGAGTCGTCG ACGACGCGTG CGAACGTGCG 
GGTGTTTCGG GCAATGTTCA CCCGAAAAAG TGGAATTACG AACAGCTCTT GAGTGAGCTG 
CGTTGCGTGT TTATCGGTCG AACAGATTTC ATCGCCTTGA CGCGCGGATT ACCCACGGGC 
GACAGGCCGC ATTACCTTCC GGGCGTGAAT GCGGTCGGGG AGAATTCAAT TCGCGACGCT 
ATATTGAGCG GAGGTGATTT ACCCATTCCG CACGAGATGC CACCCTTGAA AGTGGCCCCC 
GCTATCGTCC TCGCGGCCAT CGCGGGCGTT GAAATCGTCA TGCCGGAGGG CGTCGTCGGC 
CCACTCATGG AAGACACCGA ACCAGAAGCT TCGGACGCCG CCATAAATGA ACGTTTACGC 
AACCGTTTAG CTCCACCGTC CGATGTCCGC GACTCGCAGG AGTACATTCG TCGTTGGAGC 
AAGGGCTGGC ACGCGGCGAA GGCTCGGCGT TTACGCTCAT ACCTGACTGA ATCCGCCGTG 
CAACTGTACT TGGATCGATT CGCGCGTCTG GCTGCAAAAG ACTACGATCG CGCCGAACTC 
GAAAGCGTCG AGCGACTTTG GGCTCTTCGC GCCATAGATG AACTATGGCA GCGGCATTTG 
GTGCAGATGG AGGTGTTGCG CAGTAGCGTA CAAGTGCGAA GCTTCGGTCA CTTGGACCCG 
AAAGATGAGT TTCGCATCGA CGGCGCGCGA GCGTTTGTGT CATTGGTTGA ATCCATTCGC 
GAAGCCATGG TTAAGAACAT CTTCTTCTTC ATTGGCGCGA GCGTTGAGCC GACTACTAAT 
TTCGATGTCG ACGAGAACGA AGACGCGCAG GAGCGGCAAA CGCAAAATGA ATAGGCTAGA 
ATCTAGAACA T

Protein sequence

MSVARDRAWR DGDARQIAEL QTRVVDAVRA LDRDVRSLTN DELRGKTDAF RARLRAGETL 
DDILVEAFAV VREASTRELG LTHFDVQLIG GALLHEGWVA EMSTGEGKTL VATLPAYLNA 
LDGKGVHVVT VNDYLAARDA TEMGRIYRFL GLTVGVIQSD MTSEERQRAY ACDITYVTNT 
EIGFDYLRDN MANDAEELVV LTRPFNFAIV DEVDSVLIDE GRNPLLITGT GDVNDDDQYV 
TAAKVAESLI PGRDFKVVLK EKTAELTDEG MLHAEQILGV NDLWDAKNPW GKYILLAVKA 
RALFIKDIDY IVRDGKVIIV DPSTGRVQMN RRWNDNLHQA VEAKEGVEIN GENSIIASIS 
YQCLFKLYKK LSGMTGTAST ESEEFFTTYN LGVARVPTNK PNLRIDSQTS LFLNSIPRWY 
AVVDLIERCH AEGRPVLVGT TSVENSEILS DLLSRHRWVT NDGRKIAGVP HELLNARPQY 
AAREAEIIAQ AGRKYAVTIA TNMAGRGTDI LLGGSPVGLA KRALKEKLWP AFDLGDIGDA 
ALLMYVDLSQ EAQITLNQAE HDRVLMHFVN VAAYHVLRDC QKQCSDEREE VREVGGLQVI 
GTSIHDSRRV DNQLRGRAAR QGDPGSTVFC VSAEDELLQT YMPGWGNDKL WMFAGVDEYS 
PIVSDIVDGQ LRMVQKQIED YLSSHRQSTF ESDRVLDGQR EAVYKLRRQI LLSSQSALRE 
RLFKYMARVV DDACERAGVS GNVHPKKWNY EQLLSELRCV FIGRTDFIAL TRGLPTGDRP 
HYLPGVNAAR RLRSYLTESA VQLYLDRFAR LAAKDYDRAE LESVERLWAL RAIDELWQRH 
LVQMEVLRSS VQVRSFGHLD PKDEFRIDGA RAFVSLVESI REAMVKNIFF FIGASVEPTT 
NFDVDENEDA QERQTQNE