Gene P9303_00341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_00341
Symbol
ID	4775928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	36453
End bp	37373
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	54%
IMG OID	640085533
Product	nucleoside-diphosphate-sugar epimerase
Protein accession	YP_001016056
Protein GI	124021749
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACAG AACTTGTCAA GCAGAGTCCG CCTCTCCCCA CCGGCTCAAA GTTGCTGGTT 
CTCGGTGGAG GATTCAGTGG CCAGCATGTA GTGGCTCTGG CGAGAGCACT TGGCAGTACT 
GCTATCTGCA GCCGCAGAGA CATCAACAGC CCAGGCGCAG ACATGGCATT TGATAGTGCC 
ACCAAGCTGT TGCCAACCAC GAAAGTTCTA GAAGGAGTCA CTCATTTACT CAGCTGCATA 
CCGCCAGCAG CCGATGGGAA AGATCCAGTA CTGACATGCT TGGGCGACCA ACTCAAAGCG 
TTGCCATTGC AATGGGTTGG CTACCTCTCC ACCACAGGGG TTTACGGAGA TCGCCAAGGA 
CGCTGGGTCA CAGAAATCGA TCATCCTCAG CCTCAGCAAG CACGGAGCAA ACGAAGATTG 
GCCTGTGAAG AGGCCTGGCA AGCTTCGGGA TTACCCCTGC AGATTCTGCG ACTGCCTGGC 
ATCTACGGAC CAGGCCGCTC AGTGCTTAAA AGCGTCAACA CAGGTCAAAG CAGAATGATC 
CACAAGCCCA ACCAGGTGTT TTCAAGAATT CATGTCGATG ACATCGCAGG AGCCATCCTG 
CATCTAATCC AATGCGCTGC TGATGGACAG CGACCCATCG TGATCAACGT CACCGATGAC 
ATGCCAACAG CTTATACAGA CGTACTCGGG TTCGCCGCCC AACTACTTGG AAAGTCCCTA 
CCCGAAATTG AGCCGTTTGC AGTTGCCGCT GCACAGATGA ATCCCATGGC TCTCTCCTTC 
TGGCAAGAGA ATCGCAGGGT CAGCAATCAG CTCCTATGCC GCGAGCTTGG CTATTCCCTG 
ATGCATCCCA ACTATCACTC CGGCCTTAGA GACTGTTATC TGGCAGAAGG TTTCAAGGTC 
TCACAGACGA ATTTTCCTTA G

Protein sequence

MLTELVKQSP PLPTGSKLLV LGGGFSGQHV VALARALGST AICSRRDINS PGADMAFDSA 
TKLLPTTKVL EGVTHLLSCI PPAADGKDPV LTCLGDQLKA LPLQWVGYLS TTGVYGDRQG 
RWVTEIDHPQ PQQARSKRRL ACEEAWQASG LPLQILRLPG IYGPGRSVLK SVNTGQSRMI 
HKPNQVFSRI HVDDIAGAIL HLIQCAADGQ RPIVINVTDD MPTAYTDVLG FAAQLLGKSL 
PEIEPFAVAA AQMNPMALSF WQENRRVSNQ LLCRELGYSL MHPNYHSGLR DCYLAEGFKV 
SQTNFP