Gene OSTLU_31397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31397
Symbol
ID	5001550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	802622
End bp	803963
Gene Length	1342 bp
Protein Length	336 aa
Translation table
GC content	65%
IMG OID	640416971
Product	predicted protein
Protein accession	XP_001417609
Protein GI	145346258
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01123] branched-chain amino acid aminotransferase, group II

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.635842
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCGACGACGG CGACGACGAT GCCGGCGACG ACGCACGCGA CGATGCGCGC GACGTCGGCG 
CGCGCGACGC GCGCGAGGAC GACGGCGACG GCGACGACGG CGCGGGCGCG CGCGACGACG 
ACGAGGGTTG CGGGACGACG GCCGACGCGG TGCGCGGTGA GCGCGTCGAG CGACGCGGCG 
CACGCGGAGG CGTCGGGAGC GATCGATTGG CACGCGATGG GGTTCGGGCT GACGACGACG 
GCGTACATGT TCAAGGCGAC GTGCGAGCTC GGGGGGGAGT GGGTCGTCGA GGGCGTGGTG 
CCGTACGGCG ACCTGAGCCT GAGCCCGTCG TCGGCGGTGT TGAATTACGG TCAGGGCGTG 
TTCGAGGGCA TGAAGGCGTT CCGAACGAGC GAGGGCGAGC TGTTGGTGTT CAGGCCGGAC 
GAGAACGCGA AGCGATGCGA GGAGGGGGCG GGACGGATGT CCATGCCGGC GGTGCCGAGG 
GATTTGTTTC GAGACGCGGT GTTGAGGACG GTGAGCGCGA ACGCGGAGTA CGTCCCGCCC 
GTGGGCATGG GTTCGTTGTA TTTGCGACCG CTGTTGATCG GGACGGGGGC GATTTTGGGC 
CTTGGGCCGG CCCCGAGCTA CACGTTCTTG GTGTACTGCT CGCCCGTGGC GTCGTACTTC 
AAGGGCGGGC AGCTCACGCC CATCGACTTG ACGGTGGAGG AGACGTACCA TCGAGCCGCG 
CCCGGGGGAA GCGGGAGCAC GAAGTGCATC GGAAACTACT CCCCTGTGCT CAAGGTGCAA 
TTAGAAGCGA AGAAGCGAGG TTTCTCCGAC GTCATGTACT TGGACGCGAA GGAAAACAAG 
TACATCGAGG AGGTGAGCTC GTGCAACTTT TTCTGCGTCA AGGGGAAAAC CATCTCCACG 
CCGTCGTTGC AGGGCACGAT TCTTCCCGGG ATCACGCGCA AGTCCATCTG CGAACTCGCC 
GCCGCGCGAG GTTTCACCGT GGAAGAGCGC AACGTCTCCA TCGATGAGGT CATGAACGCG 
GACGAGTGCT TTTGCACCGG CACCGCCGTC GTCGTCGCCC CGGTCGGGTC GGTGGAGTAC 
AAGGGTAAAA CCGTCAAGTT TTGCGACGGT AAGGTCGGCC CAACGTCGCA AGCGATGTAC 
GATGAGCTCA CCGGCATCCA ACAAGGTAAG CTTCCCGACG AACGCGGTTG GAACGTCAAG 
GTGCCGAAGT TTCCCATCTC TGGCTGAGCG CCGCGTCTCG TGAGCATCGC GTCGACCTCG 
CGCCGCCCTG CGGCGTAGCA CCGCGCTCGG TTCGTTCGCC TCGCGCTCCT AGTCAAACTT 
CTTCGCTCGG TCTTCGCGCT TG

Protein sequence

MGFGLTTTAY MFKATCELGG EWVVEGVVPY GDLSLSPSSA VLNYGQGVFE GMKAFRTSEG 
ELLVFRPDEN AKRCEEGAGR MSMPAVPRDL FRDAVLRTVS ANAEYVPPVG MGSLYLRPLL 
IGTGAILGLG PAPSYTFLVY CSPVASYFKG GQLTPIDLTV EETYHRAAPG GSGSTKCIGN 
YSPVLKVQLE AKKRGFSDVM YLDAKENKYI EEVSSCNFFC VKGKTISTPS LQGTILPGIT 
RKSICELAAA RGFTVEERNV SIDEVMNADE CFCTGTAVVV APVGSVEYKG KTVKFCDGKV 
GPTSQAMYDE LTGIQQGKLP DERGWNVKVP KFPISG