Gene PMT9312_1386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMT9312_1386
Symbol
ID	3766198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9312
Kingdom	Bacteria
Replicon accession	NC_007577
Strand	-
Start bp	1300512
End bp	1302077
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	34%
IMG OID	637797919
Product	hypothetical protein
Protein accession	YP_397882
Protein GI	78779770
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAA TTATATGGCC AACAATTGAC TCAAAACATT TAATTGTTGA TTCAAAGCAA 
ATGTTGATAC TAGAGAAAGA AATGTTTTCT GATGGGATGC CCCAAGCAGC ATTGATGGAA 
AAAGCTGGTA TCCAAATTAG TAGATGGCTT TTAAAAAGGA AACCTCTTCT AAAGAATGGA 
ATAACTGTTT TAATAGGTCC TGGGCATAAT GGCGGGGATG GTGCCGTAAT AGCTAGAGAG 
CTTTTTTTGC AAGGATATTT AGTTAAGGTA TGGTGTCCAT TCCCAATAAA AAAAACATTA 
ACAATTGACC ACGTTAATTA TCTTACATCT ATTGGTGTCA CAAAATTAGA AGAGGCCCCC 
GATGCGAATG GGAAAGAACT CTGGATTGAT GCTGTTTTTG GTAACAATCA AACAAGAAAA 
GTTGATATTA AATTAATTAA ATTATTTAAT CAGAAATTTC ATAACAAATA TGGCAAGGTA 
ATAAGTATTG ATATTCCTAC AGGATTATGT CCTGATAAAG GAGAGCCTGT TTTTGATGAT 
GCAGTAAAGG CAGATTATAC TTTAGCTGTA GGTCTTAATA AAATTGGGTT AACGCTAGAT 
TCTGCTCTAC CTTTTATTGG AGAATTGAAC CATATTGATG TTGGGGTACC TATTAGTAAA 
TTGTCCAATG TTGAAAAAAA GATTTTTAAG GTTACTTACA AAGATTTAAA AAATATTGAT 
TTACCTTTTC TACCAAAAAA TTCCAACAAA TATAAAAGAG GAAGAACATT ATTAATCGCC 
GGGAGTGAAA AATATCCTGG CGCTGCATAC TTAGCATTAA AAGGGGCCAT ATCAAGTGGA 
GCAGGTTTTA TCTCTGCTGT CCTGCCAGAT TTGGTTGCTG AATCTATTTG GCAAGTTGCT 
CCAGAAATAG TTTTAAAAGG AACTATGCAA TCTAATCAAA ATGGAAATGC ATCTTTATTA 
AGTGCATTAA AGAATATTGA TTTAAGTGCA TTTGATTCAT TAGCTGTAGG TCCAGGGATA 
GGAATTGATA GTGATGATTG GGAAAAATCA AAAGACTATC TTTTGAGTTT TGAAGGATTA 
TTGATCTTGG ATGCAGATGC ACTCAATAGA ATCTCGGAAT CTAAATTAGG ATCAAAATTT 
TTTTTAGGGA GGAAATTCAA AACATGGATT ACACCTCATA GCAAAGAGTT TTCAAGGTTA 
TTCCCTAATA TCAAAGGTGA GACTAATGTT GAAATAGCTC TTAATGCAGC AAAAGAATTT 
AATATAAGTG TTTTGTTAAA GGGAGCTAAT AGCACAGTCG CTGACAATAA AAAAGCATGG 
CAACTTTTTG GAACCGATTC TCAGACAGCC AGAGCAGGAT TGGGTGATCT TTTATCTGGA 
TTTGTGGCGG GCAGTTCTGC GATTGATTTA ACCTTTAGTA GAAATATAAC AACCGAATTT 
TTTGCTAAAT ATGTACTTTT GCATTCATTT GCTGCATCAA AGTGTAAAAA GGGATCAAAT 
GCATCTGCAA TTGGTGATGA ATTATCTAAA CTAATGAGAA ATAGGAAAAC GAGACAAATA 
TCTTGA

Protein sequence

MNEIIWPTID SKHLIVDSKQ MLILEKEMFS DGMPQAALME KAGIQISRWL LKRKPLLKNG 
ITVLIGPGHN GGDGAVIARE LFLQGYLVKV WCPFPIKKTL TIDHVNYLTS IGVTKLEEAP 
DANGKELWID AVFGNNQTRK VDIKLIKLFN QKFHNKYGKV ISIDIPTGLC PDKGEPVFDD 
AVKADYTLAV GLNKIGLTLD SALPFIGELN HIDVGVPISK LSNVEKKIFK VTYKDLKNID 
LPFLPKNSNK YKRGRTLLIA GSEKYPGAAY LALKGAISSG AGFISAVLPD LVAESIWQVA 
PEIVLKGTMQ SNQNGNASLL SALKNIDLSA FDSLAVGPGI GIDSDDWEKS KDYLLSFEGL 
LILDADALNR ISESKLGSKF FLGRKFKTWI TPHSKEFSRL FPNIKGETNV EIALNAAKEF 
NISVLLKGAN STVADNKKAW QLFGTDSQTA RAGLGDLLSG FVAGSSAIDL TFSRNITTEF 
FAKYVLLHSF AASKCKKGSN ASAIGDELSK LMRNRKTRQI S