Gene P9303_08881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_08881
Symbol	thrA
ID	4776348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	805183
End bp	806499
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	56%
IMG OID	640086397
Product	homoserine dehydrogenase
Protein accession	YP_001016904
Protein GI	124022597
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAGA AGATAGGAGT TGGTCTCCTG GGGCTTGGAA CAGTAGGCGC CGGTGTTGCA 
GGCATCCTCC AAGCCCCCGA AGGGCGGCAT CCTCTGGTGG CAGAGCTTGA ACTGGTGCGT 
GTAGCGGTTC GAAATCTGCA ACGACCTCGC TCGATTGAAC TTCCCGCATC CTTGCTGACC 
AACAACCCAC AGGCTGTTGT TGATGATCCC TCTGTGCAAG TGGTTGTTGA AGTCATGGGA 
GGGATCGAAC CAGCCCGAAC CCTGATCATG CGAGCCATTG CCGCCGGCAA AGCAGTTGTT 
ACAGCTAACA AAGCCGTAAT TGCAAGACAT GGCGAAGAGA TTGCAGCTGC TGCAGCTGCT 
GCAGGGGTAT ACGTACTGAT CGAAGCTGCC GTCGGCGGAG GCATCCCGAT CATCGAGCCA 
CTTAAGCAAT CACTAGGTGG CAACCGGATC GAACGCGTGA GCGGCATCAT CAACGGCACC 
ACCAACTACA TCCTCAGTCG CATGGCACAG GAAGGGGTGG CCTATGACGA CGTGCTCAAG 
ACCGCCCAGG ATCTTGGCTA TGCAGAGGCA GATCCAGCGG CCGACGTTGA GGGCTTCGAT 
GCAGCAGACA AGATTGCCAT CCTCAGTGGA CTGGCCTTCG GTGGACCTGT CAACCGTGAC 
TCAATTCCCA CCCAAGGCAT CAACAAGCTT CAAAGCCGCG ATGTGGACTA CGCCAAACAG 
CTTGGCTACA GGGTGAAATT ATTGGCTGTC GCCGAACGTC TCAACTCAGA CGCTCAGACC 
AGTCAGTCCT TGCCCTTAGC TGTAAGGGTG CAACCAACAA TGGTGCCTCT AGACCACCCG 
CTTGCAGGAG TAAATGGCGT GAACAACGCC ATCCTGGTTG AGGGCGATCC GATCGGCCGC 
GTGATGTTTT ATGGCCCAGG AGCAGGTTCT GGACCCACCG CCTCTGCTGT GGTAGCTGAC 
ATCCTCAACA TCGCTGGCAT ACGCCAACTA GGTGAAGTCC ACGGCAGCCT CGATCCCCTT 
CTCGCCGCAA GCAGTTGGCG TTCCTGTCAC CTCGTTGATC CAAGTGCCAT CCGTCAGCGC 
AACTATGTGC GCTTCAATGC AGAGGACACA CCAGGCGTGA TCGGTCGGAT CGGTAGCTGC 
TTCGGCGATC GTGCAATTTC AATTCAATCA ATCGTGCAAT TCGATGCCTC CGATGCCGGC 
GCAGAAATCG TTGTAATTAC CCATGAAATA AGTCAAGGCC AGATGCAAGA TGCCCTTACT 
GCAATCACCT CTATGGCTGA GGTCAAAGGA CTTGCCGCCC ATCTCAGCTG CCTTTAA

Protein sequence

MGKKIGVGLL GLGTVGAGVA GILQAPEGRH PLVAELELVR VAVRNLQRPR SIELPASLLT 
NNPQAVVDDP SVQVVVEVMG GIEPARTLIM RAIAAGKAVV TANKAVIARH GEEIAAAAAA 
AGVYVLIEAA VGGGIPIIEP LKQSLGGNRI ERVSGIINGT TNYILSRMAQ EGVAYDDVLK 
TAQDLGYAEA DPAADVEGFD AADKIAILSG LAFGGPVNRD SIPTQGINKL QSRDVDYAKQ 
LGYRVKLLAV AERLNSDAQT SQSLPLAVRV QPTMVPLDHP LAGVNGVNNA ILVEGDPIGR 
VMFYGPGAGS GPTASAVVAD ILNIAGIRQL GEVHGSLDPL LAASSWRSCH LVDPSAIRQR 
NYVRFNAEDT PGVIGRIGSC FGDRAISIQS IVQFDASDAG AEIVVITHEI SQGQMQDALT 
AITSMAEVKG LAAHLSCL