Gene A9601_19251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_19251
Symbol	thrC
ID	4718665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1668615
End bp	1669718
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	32%
IMG OID	640079660
Product	threonine synthase
Protein accession	YP_001010314
Protein GI	123969457
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.373874
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGTTAT TAAATAAAAT AAAAAATAAA CTGCGTATTA ATTACAGAAA AAAAAGATGG 
CCAGGTCTAA TAGAAGCTTA TAAACAATAT CTTCCAGTTA CAAAGAAAAC TCCTATTATT 
TCCCTAAATG AAGGAAATAC ACCACTAATC CTAAGCGAGT CAATTAGCAA CTTAATTGGA 
AATAGAACAA AAGTTTTTTT AAAATATGAT GGCCTTAATC CAACTGGATC TTTTAAAGAT 
CGTGGAATGA CTATGGCAAT TAGCAAAGCA AAAGAAGAAG GACGAGAAGC AGTAATTTGT 
GCAAGTACTG GAAATACATC TGCTGCTGCT GCTGCATATG CTTCGAGAGG AGGATTAAAA 
CCTTATGTTT TAATTCCAGA AGGATTTGTT GCACAAGGAA AGCTTGCGCA AGCATTAATG 
TATGGTGCTG AGATAATATC TATTAACGGA AACTTTGATA AGGCTCTTGA AATTGTTAGA 
GATTTATCCT CAGAACATCC TATAGAACTT GTTAATTCTG TTAATCCATA TCGAATACAA 
GGACAAAAAA CAGCAGCTTT TGAAATAGTT GATGACTTAG GTTATGCTCC TGATTGGCTT 
TGTATTCCTA TGGGTAATGC AGGAAACATA ACTGCTTATT GGATGGGATT TAAAGAATAT 
TCAAAAATAA AAAGCAATTT GAAATTACCA ATAATGATGG GTTTTCAGTC CGAAGGCTCT 
GCTCCATTAG TAAAAAATAT AATAGTTAAG GATCCAGAAA CAATTGCAAC TGCAATAAGA 
ATTGGAAATC CTGTAAATAG AGAAAAAGCC AAAAAAGTAA GGAAGGAGAG TAAAGGAGAC 
TTTCAATCAG TTACAGATGA AGAAATAATC AATGCTTATA AAATTCTTGC CAAAGAGGGA 
GTATTTTGTG AACCTGCCAG TGCAGCATCA GTTGCTGGAC TAATTAAAAA TAAAAATAGA 
ATTCAGAAAG AATCGACTAT TGTTTGTGTT CTGACTGGAA ATGGATTGAA AGATCCTGAT 
TGCGCTATTA AAAATAACGA TGCTATTTTT AGGAAAAATA TTGAACCTTC ATTAAAAAAT 
ATAACTAAAA TCTTAGGATA TTAA

Protein sequence

MVLLNKIKNK LRINYRKKRW PGLIEAYKQY LPVTKKTPII SLNEGNTPLI LSESISNLIG 
NRTKVFLKYD GLNPTGSFKD RGMTMAISKA KEEGREAVIC ASTGNTSAAA AAYASRGGLK 
PYVLIPEGFV AQGKLAQALM YGAEIISING NFDKALEIVR DLSSEHPIEL VNSVNPYRIQ 
GQKTAAFEIV DDLGYAPDWL CIPMGNAGNI TAYWMGFKEY SKIKSNLKLP IMMGFQSEGS 
APLVKNIIVK DPETIATAIR IGNPVNREKA KKVRKESKGD FQSVTDEEII NAYKILAKEG 
VFCEPASAAS VAGLIKNKNR IQKESTIVCV LTGNGLKDPD CAIKNNDAIF RKNIEPSLKN 
ITKILGY