Gene P9211_12401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_12401
Symbol
ID	5731236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1115687
End bp	1116688
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	38%
IMG OID	641285608
Product	nucleoside-diphosphate-sugar epimerase
Protein accession	YP_001551125
Protein GI	159903781
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.509931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00693738
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTAGGA AAGTACTGGT TACTGGTGCG GACGGGTTTA TAGGCTCTCA TCTGGTAGAG 
AGCTTGCTAG ACAATGGCTA TGAGGTTAAA CCTTTTTGTT TCTATAATTC AAGTGGGAGC 
TGGGGATGGC TAGAAGAGCT ATGTGATGAA AAAAGCAAGG AGCTTGATGT CTTTTTAGGT 
GATATAAGAG ACCCTGTTTG TGTCAAGGAA GCCATGAAAG GATGCGACAT GGTATTCCAC 
CTCGCAGCAC TAATAGGAAT TCCTTATAGC TACATAGCCG CTAGAAGTTA TATAGAAACA 
AACATTATTG GCACACTAAA TGTATTAGAG GCAGCAAAAG ATTTAGGGGT TTCGAAAATA 
ATTCACACGT CTACGTCAGA AACATATGGT ACGGCACAAT CTGTTCCTAT AAATGAAAAG 
CACCCACTCT CTGGCCAATC TCCATATTCT GCAAGTAAAA TCGGGGCTGA CCAAATTGCT 
CTTAGCTTTT GGCATAGCTT CAACATTCCC GTAACTGTTA TACGTCCATT TAATACTTTT 
GGCCCTCGCC AGAGTAATAG AGCTGTAATA CCTACGATTA TTAGTCAAAT TGCATCAGGT 
GCAAAAAAAA TTGAACTGGG CTCGCTTTCG CCAACAAGAG ACTTTACTTA TGTGTTAGAT 
ACATGCTCAG CCTATATAGC AATCGCCAAT AGCAATAAAG TCACTGGGAA GGTAATTAAT 
GCTGCTAGTA ATTTTGAAAT ATCAATTGGT GATACAGCAA GCTTAATTGC ATCTTTAATG 
CAATCTAAAG TAGATCTTTG TACTGATTCA AAGAGAATTA GGCCAATTAA TTCAGAGGTC 
AACAGGTTAT ATGGAGACAA TAGTCTTATA AAAGACTTGA CAGATTGGCA GCCTAAATTC 
TCTGGTAAAA ATGGATTTAA TAATGGCCTT AAAAAGACTA TAGAGTGGTT TCAAAAACCA 
TATAACCTAA GTAAATATAA GCACAATATT TACTCAATAT AA

Protein sequence

MTRKVLVTGA DGFIGSHLVE SLLDNGYEVK PFCFYNSSGS WGWLEELCDE KSKELDVFLG 
DIRDPVCVKE AMKGCDMVFH LAALIGIPYS YIAARSYIET NIIGTLNVLE AAKDLGVSKI 
IHTSTSETYG TAQSVPINEK HPLSGQSPYS ASKIGADQIA LSFWHSFNIP VTVIRPFNTF 
GPRQSNRAVI PTIISQIASG AKKIELGSLS PTRDFTYVLD TCSAYIAIAN SNKVTGKVIN 
AASNFEISIG DTASLIASLM QSKVDLCTDS KRIRPINSEV NRLYGDNSLI KDLTDWQPKF 
SGKNGFNNGL KKTIEWFQKP YNLSKYKHNI YSI