Gene P9211_12841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_12841
Symbol
ID	5731578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1158368
End bp	1159405
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	37%
IMG OID	641285654
Product	putative nucleotide sugar epimerase
Protein accession	YP_001551169
Protein GI	159903825
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.363741
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0780964
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCTT TCTCAAGACC TTTTTTAGTT ACAGGTGCAG CGGGATTTAT TGGAGCAGCT 
TTAGTAAAAA AGCTGCTTAA AAATGGAGAA AAAGTAATTG GTATAGACGA TTTAAATTCT 
TATTATGATC CTGGCTTAAA ACAAGCAAGA CTTGATGAGA TTCAGAAAAT ATTAAAACCT 
TCTTCAAGTG AATGGGCTTT TTACAAAATT GGTTTAGAAG ATATGGATTC TTTAAGGGAA 
CTATTTCTCG AAAAATCACC TTCGGTTGTG GTTAACCTTG CAGCGCAGGC AGGAGTTAGG 
TATTCAATAG AAAACCCATC TGCATATCTC AATAGTAATT TGGTTGGATT TTTCAATATT 
CTAGAACTTT GTCGTCATCA TTCCGTTGAA AATTTGATAT ATGCTTCAAG CAGCTCTGTT 
TATGGAGGTA ATAGGAATCT ACCTTTTGTG GAAACTCAGC CAGTTAATCA TCCTGTAAGT 
TTCTATGCAG CTACAAAAAA ATCTAATGAG TTGATGGCTC ATTCATATAG TCATCTTTAT 
AAAATTCCTG CCACAGGTTT AAGGTTCTTC ACAGTATATG GCCCATGGGG CAGACCTGAC 
ATGGCTCCAA TGATTTTTGC TAAAGCAATT TTTTCTGGGA AGCCGATCAA CATTTATAAC 
CAAGGGGAGA TGCTTAGGGA TTTCACTTAT ATAGATGATA TAGCTGAGTC GCTACTTCGT 
TGTTGTTACA AGCCAGCTAC TCCGAATTCT AATTTCGACT CATTGAACCC TGACCCTTCA 
AGTTCTTTGG CTTCGCATCG CATTTTTAAT ATAGGAAACA GTGAGCCAAT AGAGCTTTTA 
AGGTTTATTG AATTATTAGA AGACTCTTTA GGCATAAGGG CCATTAAAAA TATGCTGCCT 
ATGCAGCTTG GAGATGTAGT TGCAACTGCT GCTGATACAA ATTTACTTGA AAAGTGGATA 
GATTTTAGGC CAAGAACATC TATAGAAGAG GGAGTCAAGA TGTTTACAAA ATGGTATCGC 
GACTTTTATA AATGCTGA

Protein sequence

MPSFSRPFLV TGAAGFIGAA LVKKLLKNGE KVIGIDDLNS YYDPGLKQAR LDEIQKILKP 
SSSEWAFYKI GLEDMDSLRE LFLEKSPSVV VNLAAQAGVR YSIENPSAYL NSNLVGFFNI 
LELCRHHSVE NLIYASSSSV YGGNRNLPFV ETQPVNHPVS FYAATKKSNE LMAHSYSHLY 
KIPATGLRFF TVYGPWGRPD MAPMIFAKAI FSGKPINIYN QGEMLRDFTY IDDIAESLLR 
CCYKPATPNS NFDSLNPDPS SSLASHRIFN IGNSEPIELL RFIELLEDSL GIRAIKNMLP 
MQLGDVVATA ADTNLLEKWI DFRPRTSIEE GVKMFTKWYR DFYKC