Gene NATL1_17081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_17081
Symbol	acoA
ID	4781030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1393083
End bp	1394177
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	42%
IMG OID	640084992
Product	pyruvate dehydrogenase E1 alpha subunit
Protein accession	YP_001015528
Protein GI	124026413
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATATGA ACGAAGTCAT GTCTCACAAC CAGGACAAAA CAGGCCAAGA CCCTATTCAG 
CACAGGGAAC ACGCCGACAG GCTAAGCAAT CTTGGCAACA CCAAACCAGC TCAAATCAAT 
AGAGAAATTG GTTTAAATCT TTTCAAAGAT ATGACTTTGG GAAGACGATT TGAAGATAAA 
TGCGCTGAAA TGTATTACAG AGGGAAGATG TTTGGGTTTG TTCATCTTTA CAACGGGCAA 
GAAGCAATAA GTACAGGTGT TATTGGTGCG ATGAAACGCA AACACGACTG GTTTTGCAGT 
ACCTACAGAG ATCATGTTCA TGCTTTGAGT GCTGGAGTGC CTGCGAAAGA GGTGATGAGC 
GAGCTATTTG GGAAAGAGAC AGGTTGCAGC AAAGGCAGAG GTGGATCTAT GCATCTGTTC 
TCTAAAGAAC ATCACCTACT TGGAGGTTAT GCCTTTATTG GTGAAGGTAT TCCAGTTGCC 
CTTGGAGCAG CTTTCAGCAG TAAATACAAA AGAGAGGCTC TTAAAGAAAG TAGTGATTCT 
GTAACTGCAG CATTTTTTGG AGATGGTACT TGCAATATTG GTCAGTTTTA TGAATGTTTA 
AATATGGCCC AGCTATGGAA ATTACCGATC ATATTTGTAG TCGAAAATAA TAAATGGGCT 
ATTGGGATGG CCCATGACAG AGCAACTAGT GAGACAGAAA TATGGAGAAA AGCTTCAGCA 
TTTGGCATGC ACGGAGAAGA GATTGACGGT ATGGACGTTT TAGCAGTAAG AGGGGCTGCC 
GAAAGGGCCC TAGAGCGGGC AAGAGCTGGA GAAGGCCCCA CTTTGATAGA ATGCCTCACT 
TACAGATTCA GGGGGCATTC ATTAGCTGAC CCAGACGAGC TTAGATCTGA AAAGGAAAAG 
GAATTCTGGG CTAAAAGAGA TCCAATTAAA AAGTTAAAAA ATGATTTAAC TAGTTCTGGC 
TTAGTCTCTG ATGAAGAATT AAAAAATATT GAGAAAGAAA TTGATCTAGA AGTTAACGAT 
GCTGTTGAAT TTGCTTTAAA CGCCCCAGAG CCTGACCCTA GTGAGTTAAC AAAATATATT 
TGGGCAGAAA ACTAA

Protein sequence

MNMNEVMSHN QDKTGQDPIQ HREHADRLSN LGNTKPAQIN REIGLNLFKD MTLGRRFEDK 
CAEMYYRGKM FGFVHLYNGQ EAISTGVIGA MKRKHDWFCS TYRDHVHALS AGVPAKEVMS 
ELFGKETGCS KGRGGSMHLF SKEHHLLGGY AFIGEGIPVA LGAAFSSKYK REALKESSDS 
VTAAFFGDGT CNIGQFYECL NMAQLWKLPI IFVVENNKWA IGMAHDRATS ETEIWRKASA 
FGMHGEEIDG MDVLAVRGAA ERALERARAG EGPTLIECLT YRFRGHSLAD PDELRSEKEK 
EFWAKRDPIK KLKNDLTSSG LVSDEELKNI EKEIDLEVND AVEFALNAPE PDPSELTKYI 
WAEN