Gene OSTLU_38823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38823
Symbol
ID	5001941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009359
Strand	-
Start bp	810464
End bp	811753
Gene Length	1290 bp
Protein Length	429 aa
Translation table
GC content	62%
IMG OID	640417362
Product	MFS family transporter: phosphate/sugar
Protein accession	XP_001418115
Protein GI	145347307
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.726317
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGG GAGGGCAAAA GAAGCGATGG GGGATGGTGT TCGCGCTGTT CATCGCGTTC 
GTGCTGTGTA ACTTGGACAA GGTGAACATG TCGGTGGCCA TCGTGCCGAT GGCGGAGTCG 
TTCGGGTGGA CGGCGACGCA AAAGGGCTTG GTCGCGTCCG CGTTCTTCTG GGGTTATTCG 
TTCACGCAGA TCCCGGGTGG GTGGTTGGCG AGTAAGTACG GCGGTAAAGC CGTCTTGTTC 
TGGGGCGTCA TGCTCTGGTC GTTCGGTACG CTCATCGCGC CGTGGTGCGC GGCGCTCGGC 
ATGCCGGCGC TGCTCGCGTC GAGATTCTTG GTCGGTCTCG GCGAAGGCGT CGCGCCGTCC 
GCGGCGACCG GCGTGTTGGC GAAGGGCGTT CCGCCGAGCC AGCGATCGAA GGCCGTGACC 
TCCGCCTTCG GCGGTCTCGA CGTCGGCTCG TTGTTGGGTT TGCTCATCGC GCCGCCGATC 
ATCTTCCACC TCGGCGGCTG GGCCGCCGTC TTTTACTTGT TCGGCGCCCT CGGCTTCTTC 
TGGGGCGCGT GGTGGTTCAT CTCCTACATG CGCGATTCCT CCACGGACAT GAAGGAAGTC 
GAAACCACCG GCGCTAAGAA GGGTCTCTCC ATCCCGTGGG CCGCCTTTGT GCGCAACCCG 
CAGTTTTGGG CGCTCACCGT CGCGCACTTT ACGTGGAACT ACTTTTCCTA CGGCTTGCTC 
GCGTGGTTGC CGTCCTTCTT GGCGAGCGCC ATGGGCGTGA CTTTGTCCAA GTCGTCTTTC 
CTCTCCATTC TTCCTTACTT GTCCACCGTC ATCGTGACCG CGCTCATCGC CCCACTCGCC 
GGTGAACTCG AGGCGAAGAA GAAGCTCACG CGAACGCAAA TTCGCAAGGG CTCGCAGACG 
CTCTGCTTTG GCGTCGGCGC CGTGACGCTC ACGATGATTG GCTTGATCGT GAACGCCACC 
CCGGTGGCCG CGGTGACGAA CCAAACCATC GGCATGGTTG TCGGTCTCCT GTCCGTCACC 
TTCGGCTTCG CCGCGTTCAT CCGCACTGGT TTGTTCTGCG GTCACCAAGA CCTTTCGCCG 
AAGTACGCGT CCATCATGTT GGGCGTCACC AACACGGCGG CGGCCATCGC GTCGACTCTT 
TCCACCTTCT TCACCGGTCT TTTCCTTTCC ATGACCGGCG GCAACTGGGC GTACTCCTTG 
TTCTTCCCGA TCGCTGCCCT TCAATTGGTT TCCGTGTTCG TCTTCCTCAT CTGGAAGTCC 
GACCCGGTTG ACTTCGACGC CGTCGCCTAA

Protein sequence

MTEGGQKKRW GMVFALFIAF VLCNLDKVNM SVAIVPMAES FGWTATQKGL VASAFFWGYS 
FTQIPGGWLA SKYGGKAVLF WGVMLWSFGT LIAPWCAALG MPALLASRFL VGLGEGVAPS 
AATGVLAKGV PPSQRSKAVT SAFGGLDVGS LLGLLIAPPI IFHLGGWAAV FYLFGALGFF 
WGAWWFISYM RDSSTDMKEV ETTGAKKGLS IPWAAFVRNP QFWALTVAHF TWNYFSYGLL 
AWLPSFLASA MGVTLSKSSF LSILPYLSTV IVTALIAPLA GELEAKKKLT RTQIRKGSQT 
LCFGVGAVTL TMIGLIVNAT PVAAVTNQTI GMVVGLLSVT FGFAAFIRTG LFCGHQDLSP 
KYASIMLGVT NTAAAIASTL STFFTGLFLS MTGGNWAYSL FFPIAALQLV SVFVFLIWKS 
DPVDFDAVA