Gene OSTLU_27563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_27563
Symbol
ID	5005278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	-
Start bp	517162
End bp	518702
Gene Length	1541 bp
Protein Length	512 aa
Translation table
GC content	65%
IMG OID	640420699
Product	predicted protein
Protein accession	XP_001421486
Protein GI	145354427
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0657659
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGATGCCGAC CGAGACGGCG CGAACGCACG CGCGCGGGCT CGTGGATTAT CTCAACGACG 
CGTGGACGGC GTACCACGCG ACGCGCGCGA CGTGCGAGGC GCTCGCGCGG CGAGGATTCG 
TCGAGCTCGA CGAGCGCGCG ACGTGGTCGT TGGCGCGCGG GGGGAGGTAC TTTTACACGC 
GGAACGCGTC GGCGGTGGTG GCGTTCGCGG TGGGGGGTGG ATACGAACCG GGAGATGGGT 
TCGTGATCGT CGGCGCGCAC ACGGACTCGC CGTGTCCGAA GCTGAAGCCG AACACGCGCG 
TGGAGGGGGG CGACGAGGTG CGCGTGCGCG TGCAGCCGTA CGGCGGCGGG CTGTGGCACA 
CGTGGTTCGA TCGCGATTTA GGGATCGCGG GACGGGTGGT GGTGAAATCG TCGCACACGG 
GGGAGATTTT GCATCGATTG GTGCGGATAG ATCGGGCGGT GTGTCGGATT CCGACGCTGG 
CGATTCACTT GGATCGAAAC GTCAACAGCG AGGGGATGAA GGTGAACTTT CAGCAGCACA 
TGGCGCCGAT TTTGGCGACG CGCGCGAAGG CCGAAGCGAA AGACGACGAC GAGGGTGGGG 
AGAAAACGAC GGCGAGCGAC GGTAAGGGGT CGAGCGAACG GCATCACCCG CTGCTGCTGA 
CGTTGCTCGC CAAGGAACTC GGGTGCGCGC CGGGCGACAT CGTCGATTTC GATCTACAGC 
TGTGCGACAC GCAACCGAGC GCGATCGGTG GGGCGCAGAA TGAGTTCATT TACAGCGGCC 
GTTTGGATAA CCTGGCGAGT TGTTACACAT CGTTGCACGC GCTGATGAAC GCCTCGACGG 
ATGAGGCGTT GGCGGACGCG CGAGGCGTGC GCATGATTAT GCACTTTGAC CACGAAGAAG 
TCGGAAGCGA GTCTTCGAGC GGCGCCGCGG GCGCGATGAC CACGGACGCG ATCAAACGCA 
TCGCAGCTGC GCTGAGCCAA GGAAGCGTGG AAGGCTTGGA CGAGCGCACG CGCCGCGCGT 
CGTTTTGCGT CAGCTCCGAC ATGGCGCACG CCTTGCACCC AAACTACGCC GATCGACACG 
AACCGGCGCA CGCGCCGAAA ATGCACGGCG GCTTAGTCAT CAAGCACAAC GCCAACCAGC 
GTTACGCCAC CGATGCCGTG ACGGCATTCA TGTTCCGCGA GATTGGCGAG CGCGCGGGCG 
TTCCCGTGCA AGAGTTCGTC GTGCGAAGCG ACACCGGTTG CGGTTCCACC ATTGGGCCGA 
TTTTCTCCAC CCGAACCGGC ATTCGCACCG TGGACGTCGG CGCCGCGCAG CTTTCCATGC 
ACTCCATCCG CGAAGTCTGC GGCGCTGACG ACATAGACCA CGCCGTGAAG CACCTCACCG 
CGGTTTACCT CCACTTTATC GATCTCGATC GCACCCTCAT AGTCGACGGA GCCATCGGCA 
CGCTGTGTCG CCCGTGCGAC GTCTTCGAAT CGGCGACGTC CAAGCTCTCC CTCGACGTCC 
GAGACGACGC CGCCGACGAC GCTCGCACGT ACGCCGAGTG A

Protein sequence

MPTETARTHA RGLVDYLNDA WTAYHATRAT CEALARRGFV ELDERATWSL ARGGRYFYTR 
NASAVVAFAV GGGYEPGDGF VIVGAHTDSP CPKLKPNTRV EGGDEVRVRV QPYGGGLWHT 
WFDRDLGIAG RVVVKSSHTG EILHRLVRID RAVCRIPTLA IHLDRNVNSE GMKVNFQQHM 
APILATRAKA EAKDDDEGGE KTTASDGKGS SERHHPLLLT LLAKELGCAP GDIVDFDLQL 
CDTQPSAIGG AQNEFIYSGR LDNLASCYTS LHALMNASTD EALADARGVR MIMHFDHEEV 
GSESSSGAAG AMTTDAIKRI AAALSQGSVE GLDERTRRAS FCVSSDMAHA LHPNYADRHE 
PAHAPKMHGG LVIKHNANQR YATDAVTAFM FREIGERAGV PVQEFVVRSD TGCGSTIGPI 
FSTRTGIRTV DVGAAQLSMH SIREVCGADD IDHAVKHLTA VYLHFIDLDR TLIVDGAIGT 
LCRPCDVFES ATSKLSLDVR DDAADDARTY AE