Gene P9303_21451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_21451
Symbol
ID	4777324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1908072
End bp	1909250
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	57%
IMG OID	640087653
Product	putative glycosyl transferase, group 1
Protein accession	YP_001018145
Protein GI	124023838
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTCACA TTGCCTGGCT AGGCAAAAAA ACACCGTTCT GCGGCAACGT CACCTACGGT 
CTCAACACGA CTGAGGCCCT AAGACAACGC GGCCATCAGA CCAGTTTTAT TCACTTCGAC 
AATCCAGGCG GCCTTAGCAA CGGCGAGAGC GCACTGTTGG CCAATGACCC AGAAGTGAGC 
CTGCCATACC TGGTGAAGTC ACAGGTTTAC ACCATTCCCT TCCCAGGAGC GCAGCGAGAA 
CTCAGGGAAT CATTAGAAAG ACTGCAACCC GATCTCGTTC ACGCCAGCCT CACCCTTTCC 
CCCCTCGACT TCCGGCTACC AGAACTCTGC GAGCAAATCG GTGTGCCATT GGTGGCAACT 
TTCCACCCAC CATTTGATAG CGGCATGCGC CACCTCACGG CTGGCACACA ACAGCTCACG 
TATCAGCTCT ACGCCCCTGC CCTGGCTCGC TATGACAAGG TGATCGTCTT CTCCGAGCTG 
CAAGCTGAGG TTCTTACCAA ACTTGGAGTA CAGGAACAAC GACTCGCCGT GATCCCCAAT 
GGCGTCGATC CTGAATGTTG GGCACCAACA AGTCCCCAAT GCACCAACCC AATGCAGCAA 
GAGGTGCTTG GACGTCTGGG AAATGAACGA ATTTTCCTCT ACATGGGACG CATCGCAGCA 
GAAAAAAATG TGGAGGCATT GCTGCGCGCT TGGCGGCTTG TAGAGACCAA GGGCTGCCGA 
CTGGTCATCG TTGGCGATGG CCCTCTGCGT TCGACCCTGC AAAACAACTC AACCCCAACA 
AAAGAAAACG ACGTGCTCTG GTGGGGCTAT GAGTCAGATC TCAATACCAA GGTGGCCCTA 
CTGCAATGCG CTGAAGTCTT CCTCCTGCCA AGCCTGGTCG AAGGTCTGTC TCTGGCACTG 
CTAGAGGCCA TGGCAACAGG TACAGCCTGC GTGGCCACTG ACGCCGGGGC TGATGGGGAA 
GTGTTGGATG GCGGTGCGGG CATCGTATTA AGCACACAGG GTGTCACCAG CCAATTACGC 
ACCCTGCTGC CGGTGCTCCG CGATCAGCCT GTACTAACAG CCGAACTGGG TCGCCGCGCC 
CGTATGCGCG TGCTGGAGCG ATACACCATC ACCCGCAACA TCGACGACCT GGAAACGCTC 
TACCGCGGCT TATTAGGGGC GACAAAGATG GCGGCCTAA

Protein sequence

MAHIAWLGKK TPFCGNVTYG LNTTEALRQR GHQTSFIHFD NPGGLSNGES ALLANDPEVS 
LPYLVKSQVY TIPFPGAQRE LRESLERLQP DLVHASLTLS PLDFRLPELC EQIGVPLVAT 
FHPPFDSGMR HLTAGTQQLT YQLYAPALAR YDKVIVFSEL QAEVLTKLGV QEQRLAVIPN 
GVDPECWAPT SPQCTNPMQQ EVLGRLGNER IFLYMGRIAA EKNVEALLRA WRLVETKGCR 
LVIVGDGPLR STLQNNSTPT KENDVLWWGY ESDLNTKVAL LQCAEVFLLP SLVEGLSLAL 
LEAMATGTAC VATDAGADGE VLDGGAGIVL STQGVTSQLR TLLPVLRDQP VLTAELGRRA 
RMRVLERYTI TRNIDDLETL YRGLLGATKM AA