Gene P9211_12441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_12441
Symbol	wecB
ID	5731240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1119301
End bp	1120482
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	33%
IMG OID	641285612
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001551129
Protein GI	159903785
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase [TIGR03568] UDP-N-acetyl-D-glucosamine 2-epimerase, UDP-hydrolysing

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.706059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00693738
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAAAC GCAAAAACAA AATTTGTTTT ATTACTGGAA CAAGAGCTGA ATACGGACTG 
TTGAAATGTT TAATGAAGGA AGTTGAACAA TCAAGAGATC TTTCGCTTCA GTTAGTTGTT 
ACTGGAAGTC ACTTATCCAG AATACATGGG TATACAAAAG ATGAAATTAT TAAAGACGGT 
TTTTTGATAG ATAGTGAAAT TGAAATAGAT TTAAAAGAAG ATACAAATTC ATCTACATGT 
TTCTCTCTTG CAGAGATTAT AACTAAGGCT TCAGGCACAT TTGAGCGGAT GAAACCTGAT 
TTAATCGTAT TATTAGGAGA TCGTTATGAA TTACTTGGAG CAGCTTCTGC AGCAATGGTT 
CACAGAATTC CAATTGCACA TATTCATGGA GGAGAAATAA CTGAAGGATC ATTTGATGAT 
AATATAAGGC ATTGTTTAAC TAAACTTTCC CATATTCACT TTGTAGCTAC AGAGCAATAT 
CGTAAGCGTG TCATTCAATT AGGTGAGAAA CCTTCTAATG TGCATAATGT AGGGGGGTTA 
GGCGTAGATG CAATTGACAA AATAAATCTC TTAAGTAGGG CAGATCTAGA GAAAGATATT 
GGAATAAATT TTCTCAAAAG AAATCTTATA ATTACATACC ATCCCTTAAC TCTTTCTTCA 
TCAGAGCAAA CAGAATCAGA GGTCGTTGAA CTAATAAAAG CATTATCTCG ACTGGAAAAT 
ACTCTTCAGA TTTTCACTCT ACCTAATGCT GACCCTGGTA ATTTCAGGAT CACAGAAATA 
ATAAATTCAT ATGTTAATGA AAATGATTCG GCTATTGCAT TTAAATCCCT TGGCCAATTA 
CGGTATCTTT CCTGTCTGTC TCATGTCGAT GCAGTTATTG GAAACTCATC AAGTGGACTT 
ATAGAGGCAC CCTCTTTCAA TATAGGTACA ATAAACATTG GAGAAAGGCA AAAAGGTAGA 
TTGACAGCAA AAAGTGTAAT TAATGTGAGA GCCGATGCAG ATTTAATACA TAACTCAATA 
TCTACTATAT ATACAAAAGA GTTTCAGGAA TTACTAAATG ATAATTCTAA TCCTTATGGA 
GAAGGAGAAG CCGTACAAAA GATATTGTAC ATATTGACTA ATCTCAAAAT AGAAAAATTG 
CTAAGAAAAA AATTTTTTGA TTTAGATTTT AATCTACGAT GA

Protein sequence

MNKRKNKICF ITGTRAEYGL LKCLMKEVEQ SRDLSLQLVV TGSHLSRIHG YTKDEIIKDG 
FLIDSEIEID LKEDTNSSTC FSLAEIITKA SGTFERMKPD LIVLLGDRYE LLGAASAAMV 
HRIPIAHIHG GEITEGSFDD NIRHCLTKLS HIHFVATEQY RKRVIQLGEK PSNVHNVGGL 
GVDAIDKINL LSRADLEKDI GINFLKRNLI ITYHPLTLSS SEQTESEVVE LIKALSRLEN 
TLQIFTLPNA DPGNFRITEI INSYVNENDS AIAFKSLGQL RYLSCLSHVD AVIGNSSSGL 
IEAPSFNIGT INIGERQKGR LTAKSVINVR ADADLIHNSI STIYTKEFQE LLNDNSNPYG 
EGEAVQKILY ILTNLKIEKL LRKKFFDLDF NLR