Gene OSTLU_30899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_30899
Symbol
ID	5000891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	948475
End bp	950197
Gene Length	1723 bp
Protein Length	529 aa
Translation table
GC content	61%
IMG OID	640416312
Product	AAAP family transporter: amino acid
Protein accession	XP_001417102
Protein GI	145345187
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCTTCGGGT ACGCTTGTGA CGTTAACGTT GGCGCAAAGC GTGCGGGGTG AGCGAGTACA 
ACGCCAAAAC GCGCACGAAC GCAAGCTCGG AGGGTCGAGT TGAAGATCTT TGTCCCGAGC 
GAACGCCAAT GTCGAGCGAC ACCACGGACG CGCACGACGC CGCGCACGCC GAGAGCGAGC 
TCGAGCACAT GATTTCGAGC GCCATGAGCG CGCTCGCGAG CTCGGCGCTC GTCGGTGAAA 
CTGACGGTCG GGCGAAGCGG CGAGGCAACG TCTCCGGGTC GACGGCGACG CTCGCGAACT 
GCGCCATCGG CGCGGGAGTG CTGGCGACGC CGTTCGCGGT GAGTAAGTTC GGCACCGTCG 
GTGGTGGAAT TGTCGTACTC ATCGCCGCGC TACTCGTCGC GTACACGCTC GTCGTGCTCG 
TGCGAGCGGG ATCGGCGTTC GAGTCCACGT CGTATCAAGG CTTGGTGCGC GACGCGTTCG 
GAACTCGCGC GTCTCGATTC GTGAGCGGGA CGTTGGTGGT GTACTTGTTC GGATCGTGCG 
TGGCATATTT GATCATCATC GGTGATTCGT ACGCGAAAGT GATGAGCGCG GTCGCCAGCG 
CGGGGTCGAG CGCGTGGTGG GGAAGTCGAC GATTCGCCAT CGCCGTCGGA GCGACGTTTT 
TGGTGACGCC GCTGAGCTTA CTTCGAGAGA TGAGTCGGTT GGCACCGGCG AGTGCGGTAG 
CCCTGGTTTC GCTCGCGTAC ACCGCCGCGA CGATCACGTG CAAAGGAATG ACCCGCACTT 
CTGGCGGTGA TGACGCCAAA GCCGTGGCTT TCAAATTCAA CACCGATTCC ATCTCCGCCG 
TGCCCATCGT CGTCTTCGCG TTTCAGTGCC ATATTCAAGT CTTGGCGATT TTCTCCGAGC 
TATCGGCAGA TTCCGCCCCT GAACCGCATT TCGAAGACGA CATCGAACCT ATCGATGGCG 
ACGCTAGGCA AGCCACCGAG GCGCGACGCC TCAGTCGAAT GTACACCGTC ATCGCGCTCG 
CCGTCGGCGC GTGCTTTTGG GGCTACCTCC TCGTGGGCGA GTTCGCGTAC GTGTCGCATC 
CAAACGTGAC GTCTAACGTC CTAGATAGCT ACGGCAAGGA TGACAAAGCC ATGATGGTGG 
CGACAATCTT CATGGGCTTC AGCGCCGTCG CATCGTTTCC GGTGAATCAT CACGCCGCGC 
GCGCGGCTTT GGACGACTTA CTTGCGGAGG CGTTTGGTTG GGAGGTGTGC GCGCCGGGAC 
AAGCGCCGGT GACTCGTCAC GCGACGCAAA CGTTCGCGTT CGTCGTCTTC ACCACGCTCG 
TAGCGTTCGC GGTGGAAGAT TTAGGAAAGG TATTCGAGTT CATCGGTGCC ACGTGCGGAA 
GTCTCGTCAT GTTCGTGATC CCAGCCTTGC TCTTGCTGCA TCCGAAGATG CGCTCGTCGA 
AGGCCGCGGC GGACGTCGAG GAGCCGGCGG ACGATTTGCT CGATGGTCTG GACGACGTCA 
CGAGGGAACT TTTGAGTTCC GCTCGCGATC TTCTCGAACA GGATTTTGAC GAGGAAGGTA 
ACATCCTTCC ATCAGGCGAC GATGCGAACG CGTCCTTCGC GGCAAAACCG GGAGTCGGAA 
CCGTCGTCGT CGCCGGCGCG CTGATTTTAT TCGCGAGCTT TGTGGCGATT AGCAACGTGT 
ATGTGCTGCT TTTCAGCGAA CAGAAGCGCG ATTCGTAGAC GCT

Protein sequence

MSSDTTDAHD AAHAESELEH MISSAMSALA SSALVGETDG RAKRRGNVSG STATLANCAI 
GAGVLATPFA VSKFGTVGGG IVVLIAALLV AYTLVVLVRA GSAFESTSYQ GLVRDAFGTR 
ASRFVSGTLV VYLFGSCVAY LIIIGDSYAK VMSAVASAGS SAWWGSRRFA IAVGATFLVT 
PLSLLREMSR LAPASAVALV SLAYTAATIT CKGMTRTSGG DDAKAVAFKF NTDSISAVPI 
VVFAFQCHIQ VLAIFSELSA DSAPEPHFED DIEPIDGDAR QATEARRLSR MYTVIALAVG 
ACFWGYLLVG EFAYVSHPNV TSNVLDSYGK DDKAMMVATI FMGFSAVASF PVNHHAARAA 
LDDLLAEAFG WEVCAPGQAP VTRHATQTFA FVVFTTLVAF AVEDLGKVFE FIGATCGSLV 
MFVIPALLLL HPKMRSSKAA ADVEEPADDL LDGLDDVTRE LLSSARDLLE QDFDEEGNIL 
PSGDDANASF AAKPGVGTVV VAGALILFAS FVAISNVYVL LFSEQKRDS