Gene P9303_01441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_01441
Symbol
ID	4776592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	158274
End bp	160001
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	48%
IMG OID	640085643
Product	thiamine pyrophosphate-requiring enzyme
Protein accession	YP_001016164
Protein GI	124021857
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCTCC TAAATTCAGC CAGGCAGACG ATGACTTGTG TGCCTGTGGT TCACGAAGTT 
GCAGCAGTTG TGGCTGCTGA GTATCACAAT GCAACCGTCT CATCTGGCAA GGCAGCCAAG 
CCAAGGGGGC GAGCCATTGC TCTGGTTACA GCAGGCCCGG GATTAACCAA TGCTCTGACG 
GGCCTCGCTG GGGCTTGGTT AGAAAGCCGT GAGCTACTTC TTCTTGGTGG TCAGGCGAAA 
GTGGCGGATC TTGCTTCGTC TGGTTTGCGC CAATTGGGCA TTCAGGAGGT GAATGGTGTT 
GCCATGGCCG CTCCCGTTTG CAAAAGGAGC CTTTGCTTGC GAGAACCATT GGAACAACAA 
GCATTTTTTG CTGAAGTCTC TTCAGGCTGG CAGGCTCGTC CTGGCCCTGT ATTCCTAGAG 
TTTCCGCTTG ATGTTCAAGC ATTGCAAGTT CCTGAAGCTT GGGTCGCTGG CATCGATGAA 
GCAAATATCA ACAAGGCTGA TGACGCTGCT CCTGTCATCG ACAGTGACAT GGTTCATTCA 
TTAGCAGCTT CTATAGCCGC GGCTGAGCGT CCTGTCTTGC TGCTTGGAGG GGGGATCTCT 
TCTGTAACGG CTCAGCAGTT AGAGCCTCAG CTTGCTTCGC TTGGTTTGCC AGTAATGACG 
ACGTGGAATG GAGCCGATCG CTATGGCGCA GAGCATTCCA ATTATTTTGG CAGGCCCAAT 
ACCTGGGGAC AGCGCTATAG CAATCTGCTG ATTCAGCAAT CAGATTTTTT GGTTGCGATC 
GGCAGCCGGC TTGGGCTCCA GCAGACAGGC TTTAATTGGC AAGAATTTGT GCCAGTTGGG 
AAAGTTATTC AGGTTGACAT TGATCCAGCT GAGCTGGCTA AGCCCAATCC AAAACTTGAT 
CTAGCCATTG AAGCGAATGC TAATGATTTT ATACAACAGT TGCTTAGTTT TGACTTAGGT 
AGCCACCCTG ATTGGCTTGC TTACTGTTCT GATGTTAAAA CCAGATTGCC GATTTCTGAA 
GCCTGCAATA TCACACCTGT TGGTTATCTC AATCCCTTTG AAATGGTAAT CAAGCTATCC 
ATGCTTTGCA ATGCTTCTGA TCACATTGTT CCTTGTAGTA GTGGAGGAGC ATTCACTGTA 
ATGATGCAGG CTTTTGAGCT TCAGCAGGGT CAGACAATGA TCACCGATAA GGGATTAGCG 
AGCATGGGGT ATGGCTTATC AGGTGCTATC GGAACATCAA TTGCTGACCC TGATGTACGT 
ACAGTGCTAG TTGAGGGCGA TGGTGGATTC ACCCAGAACC TTCAGGAGTT AGCAACTGTG 
GCCGTGAATA ATCTCAATCT AAAGATGTTC CTGTTTTGCA ATAATGGTTA TGCATCGATC 
AGGATGACGC AAAAGAATTA CTTTGATGGT GCTTATATGG GTTGTGATGT TTCTTCGGGT 
TTAGGCTTCC CTGATTGGTC TAAACTTGCC GAGGCTTATG GGATTGATTG CTTTGAGCTA 
GGAGAGGCTT GGTGGGATGC TGAACGATTT GACCATTTGT GGAATCACCA AGGCCCTGCT 
CTGTTTTTGG TTCCATTGCA TCCTGAACAG ACATATTCTC CTAAGATCGC TAGTCGCATT 
AGTGCTAATG GCGGCATGGA ATCAAATCCC TTGCATCGAA TGAGTCCGGA TTTAGATCAA 
GAGCTTGAGG ATTTCGTGAC ACGCTTTATT CCAAAAAAAG CGTCTTAA

Protein sequence

MHLLNSARQT MTCVPVVHEV AAVVAAEYHN ATVSSGKAAK PRGRAIALVT AGPGLTNALT 
GLAGAWLESR ELLLLGGQAK VADLASSGLR QLGIQEVNGV AMAAPVCKRS LCLREPLEQQ 
AFFAEVSSGW QARPGPVFLE FPLDVQALQV PEAWVAGIDE ANINKADDAA PVIDSDMVHS 
LAASIAAAER PVLLLGGGIS SVTAQQLEPQ LASLGLPVMT TWNGADRYGA EHSNYFGRPN 
TWGQRYSNLL IQQSDFLVAI GSRLGLQQTG FNWQEFVPVG KVIQVDIDPA ELAKPNPKLD 
LAIEANANDF IQQLLSFDLG SHPDWLAYCS DVKTRLPISE ACNITPVGYL NPFEMVIKLS 
MLCNASDHIV PCSSGGAFTV MMQAFELQQG QTMITDKGLA SMGYGLSGAI GTSIADPDVR 
TVLVEGDGGF TQNLQELATV AVNNLNLKMF LFCNNGYASI RMTQKNYFDG AYMGCDVSSG 
LGFPDWSKLA EAYGIDCFEL GEAWWDAERF DHLWNHQGPA LFLVPLHPEQ TYSPKIASRI 
SANGGMESNP LHRMSPDLDQ ELEDFVTRFI PKKAS