Gene NATL1_08581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_08581
Symbol	wecB
ID	4780247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	787607
End bp	788719
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	32%
IMG OID	640084133
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_001014681
Protein GI	124025565
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000168245
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGAAACGTA TATCAGTAAT TATTGGAACA AGGCCTGAGG CTATAAAATT TGGTCCGTTA 
ATTCTTGCTT TTCTAAAAAC CAAAGAAATA GATTTAAGGA TTATTTCAAC AGGTCAACAT 
TATGAACTAG TAGATCAAGT AAATGAATTG TTTAAAATTG TGCCCAACAA GAACCTTAAG 
ATTATGGTTC CTGGGCAAAG TCTTACAAAG ATAACTAATG AAGTTTTAAT AGGATTAAAA 
GAAGACTTTA ATGAATATCC ACCCGATTTA GTATTAGTCC AAGGAGATAC TACTTCAGCC 
TTTTCTGCTG CTCTGGCAGC ATTTTATGAA AAAATTCCAA TAGGGCATAT TGAAGCTGGG 
TTAAGAACAA ATCAAATTAT GCTTCCATAT CCTGAAGAAG CGAATAGAAG AATTATTTCC 
CAAATAGCTT CTATTCATTT TGCTCCTACT AAAATTGCTT TTGAAAATCT AAAAAAAGAA 
TCTGTACTTG GTGAAGTTTA TTTAACAGGA AATACTGTTG TTGACAGCTT ATTATTTATA 
TCAGAAAAAG CACAAATCCC AAAAATTAAA AATGTAGATT TTATAAAACA AAAAATCATA 
TTAGCTACAG TTCACAGACG TGAAAACTGG GGGGCGAATT TAAAACAAAT AGCAAAGGGT 
TTAAAAAAGA TTTTGGATGA ACATCTCGAT TATATTCTAA TCCTTCCAAT GCACCCAAAT 
AAGTCACTTA GAGAACCATT AGAGGAAATA CTTGGAGTGC ATGAAAGAGC TATATTAACA 
GAATCGTTAT CTTACAACTC ACTAGTTGGA ACACTTAAGC ACACTAAATT ATTATTAACT 
GACTCTGGAG GCCTACAAGA AGAAGCTCCC ACATTTGGAG TGCCTGTATT AGTCCTAAGA 
GATTCAACAG AACGGCCAGA AGCAATAAAA GCTGGAACTG CAAAAATTGT TGGATCAAAC 
CCAAATAAGA TTTTCAAAGA AGCTAATAAT CTTTTAACTA ACCAAAAAGA ATATCAAAAG 
ATGTCTAAAG CAATCAATCC TTTTGGAGAT GGTAAAGCAA GTGAAAGAAT TGTAAAATAT 
TGTATTGAAT TTCTTGAAAG AAATAAGAAA TAA

Protein sequence

MKRISVIIGT RPEAIKFGPL ILAFLKTKEI DLRIISTGQH YELVDQVNEL FKIVPNKNLK 
IMVPGQSLTK ITNEVLIGLK EDFNEYPPDL VLVQGDTTSA FSAALAAFYE KIPIGHIEAG 
LRTNQIMLPY PEEANRRIIS QIASIHFAPT KIAFENLKKE SVLGEVYLTG NTVVDSLLFI 
SEKAQIPKIK NVDFIKQKII LATVHRRENW GANLKQIAKG LKKILDEHLD YILILPMHPN 
KSLREPLEEI LGVHERAILT ESLSYNSLVG TLKHTKLLLT DSGGLQEEAP TFGVPVLVLR 
DSTERPEAIK AGTAKIVGSN PNKIFKEANN LLTNQKEYQK MSKAINPFGD GKASERIVKY 
CIEFLERNKK