Gene A9601_09531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_09531
Symbol	ilvA
ID	4717662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	820171
End bp	821712
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	32%
IMG OID	640078666
Product	threonine dehydratase
Protein accession	YP_001009344
Protein GI	123968486
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATT ATTTTGAAAA AATACTTCAA GCTGAAGTCT ATGAAGTTGC AAAAAAAACA 
CCACTAGAGA AAGCTCATAA TTTAAGTAAC ACACTTAATA ATGAAGTTTT TCTAAAAAGA 
GAAGATCTTC AGGATGTATT TTCATTCAAA ATAAGAGGTG CATATAACAA AATGAGTAAG 
CTAACTAATT CACAGCTTGC TCAGGGAGTA ATTACTTCTA GTGCTGGAAA TCATGCCCAA 
GGGGTTGCAC TTAGTGCCCT TAAGTTAAAT TGCCAAGCAA CCATATTAAT GCCCGTTACC 
ACACCTATAG TAAAAGTTAA TGCAGTAAAA AGTTTAAAAG CAAAAGTTAT ATTATATGGT 
GACAACTATG ATGAAACATA CAAAGAGGCA ATAAGGATTA GCCAAGAAAG AAATTTATGC 
TTTATTCATC CCTTTGATGA TCCAGAAGTA ATAGCAGGAC AAGGAACTAT AGCTATAGAA 
CTTGAACAGC AGCTTAAGGA AAAACCTTAT GCAATTTATA TTGCTGTAGG TGGTGGGGGA 
TTGATATCAG GAATATCCAT ATACGTTAAA AAAATATGGC CAGAAGTAAA AATAATTGGT 
GTAGAACCTG AAGATGCTGA CGCTATGACT AAATCATTGG AAGAAGAAAA AATTGTGGAA 
CTACCTTCTG TAGGTCAATT TGCAGATGGA GTAGCGGTAA AAAAAATTGG TAAAAATACT 
TTTGATATTG GTAGAAAATA TATAGATAAG ATGATTAGGG TTAATACTGA CGAAATCTGT 
GCTGCTATAA AAGATGTTTT TGAGGATACT AGATCCATAT TAGAGCCCGC AGGGGCCTTA 
TCAATAGCGG GAATGAAAAA AGATATTTTA AATTCGAATC ATTCAAATAG AAAAATGGTT 
GCGATTGCAT GTGGTGCAAA TATGAATTTT GAGAGGCTTA GATTTGTAGC AGAAAGAGCA 
GAACTTGGAG AGTGCAAAGA AGTAATGATG GCTGTTGAAA TTCCTGAACG TGCTGGTAGT 
CTAATTGATT TTTGTAAGTT ACTTGATAAT AGAAATCTAA CAGAATTTAG CTATAGGATG 
TCGAATTCTA AGAATGCACA GATATTTGTA GGGGTTCAAG TCTATGGTTT AAATGATAAA 
AAAAATTTAT TAAATGTATT TAGAAATTCT GAGTACTCAT TTATTGACAT AAGTGATGAT 
GAATTATCTA AAAATCATCT CAGACATATG GTAGGTGGAA GATTACCAAG GGATTTTAAA 
GAGATGGAAT ATAAAAACTT TATTGAGCTT TTATACAGAT TTGAGTTTCC TGAAAGGCCT 
GGCGCATTAA TAAACTTCTT AAATAATATG AAATCTAATT GGTCTATAAG CGTATTTCAC 
TACAGGAATT ATGGAGCTGA TGTAGGGAAA ATTGTCATTG GAGTTTTGAT CGATAAAAAT 
GAGATTTTAG AGTGGAATAA ATTTGTAAAA ATTCTAGGTT ATAAATTCTG GGATGAAACT 
CAAAACGATA CATATAGATT GTTCCTTGGT GCATCAGATT AA

Protein sequence

MNDYFEKILQ AEVYEVAKKT PLEKAHNLSN TLNNEVFLKR EDLQDVFSFK IRGAYNKMSK 
LTNSQLAQGV ITSSAGNHAQ GVALSALKLN CQATILMPVT TPIVKVNAVK SLKAKVILYG 
DNYDETYKEA IRISQERNLC FIHPFDDPEV IAGQGTIAIE LEQQLKEKPY AIYIAVGGGG 
LISGISIYVK KIWPEVKIIG VEPEDADAMT KSLEEEKIVE LPSVGQFADG VAVKKIGKNT 
FDIGRKYIDK MIRVNTDEIC AAIKDVFEDT RSILEPAGAL SIAGMKKDIL NSNHSNRKMV 
AIACGANMNF ERLRFVAERA ELGECKEVMM AVEIPERAGS LIDFCKLLDN RNLTEFSYRM 
SNSKNAQIFV GVQVYGLNDK KNLLNVFRNS EYSFIDISDD ELSKNHLRHM VGGRLPRDFK 
EMEYKNFIEL LYRFEFPERP GALINFLNNM KSNWSISVFH YRNYGADVGK IVIGVLIDKN 
EILEWNKFVK ILGYKFWDET QNDTYRLFLG ASD