Gene P9301_16881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_16881
Symbol
ID	4911854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	1420499
End bp	1421590
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	29%
IMG OID	640161286
Product	glycosyl transferase family protein
Protein accession	YP_001091912
Protein GI	126697026
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATCTG TTAATACTTG GAATTTAACT AATAATAAAC TTCATCAATT ATTTAAAGAC 
AATAACGAAT TTATTTCTAT TAAAGTCCGT GGTAATACTT GGGAGCCAAT CACTAGATGG 
CTAAGATTAG ATTCAAGAAT TTTTAGAGAA ACTACTAGCA AAGCAAGAAT AACTTTATGC 
GATATCGAAT CTCTAGCAGA AATTTATAAC TACAGATCAA TTAGATGGAA AGCAAAAAAA 
CTAACTCCTA TTCCCACTAA AGTAATACCA CAATCTATTA AAAATATTTT TCGCAAAATA 
CCAATCATAA AACAACTCGC CTATGAACTC GAAATAGTTT TTTATAAATA CAGTGAAAAT 
ATTTCTGAAC ATTTAATATC AATAGTGATT CCTGCAAGAA ATGAAGCTGG TAATAAAGAA 
CTATTAATTA ACGCTTTAAA TAAATTCAAA AATATACCAA ATAAGTTAGA AATTATATTT 
GTTGAAGGTA ATAGCAATGA TAATACATAT GACATTTTGA AAGAATTAAA AGAAAATTTC 
TCAAATTTCT TCAAGATATT TCTTTTAAAA CAAACTTCTA AAGGGAAGAA AAATGCAGTC 
GTGGAAGGGT TTAATATTTC TTCAGGTGAG ACTCTCGCCA TAATTGATTC TGATTTTACA 
GTAGATATTG ATGACAGTAT TGCAGCAATT ATGGAATCAA CCAAAAATAA AAATATACTT 
ATTAATTGCG CCCGCACAAC TTTTCCAATG GAAAAAGATG CGATGAGATG GGCAAATTAT 
ATAGGAAATA GACTTTTCGC AATTTTTCTA TCAATTCTAA TAAATAAGCC CGTATCAGAT 
TCACTCTGTG GAACAAAAGT TTTTTCAAGA AAATTCTTTA AACTTATGAA ACAAAACGGA 
AGTTGGGATT CCAAGTCTGA CCCATTTGGA GACTTTACAA TAATATTTGA AGCTGCGAAA 
AATAACATTA AAATACTAAA TTATCCTGTT AGATATTACG CTAGAAAATC AGGCGCACCA 
AATATATCTA GATGGATAGA TGGATTAAAA CTGCTCAAAG TATGCTGGAT TTATATGATT 
TCTGATATCT AG

Protein sequence

MRSVNTWNLT NNKLHQLFKD NNEFISIKVR GNTWEPITRW LRLDSRIFRE TTSKARITLC 
DIESLAEIYN YRSIRWKAKK LTPIPTKVIP QSIKNIFRKI PIIKQLAYEL EIVFYKYSEN 
ISEHLISIVI PARNEAGNKE LLINALNKFK NIPNKLEIIF VEGNSNDNTY DILKELKENF 
SNFFKIFLLK QTSKGKKNAV VEGFNISSGE TLAIIDSDFT VDIDDSIAAI MESTKNKNIL 
INCARTTFPM EKDAMRWANY IGNRLFAIFL SILINKPVSD SLCGTKVFSR KFFKLMKQNG 
SWDSKSDPFG DFTIIFEAAK NNIKILNYPV RYYARKSGAP NISRWIDGLK LLKVCWIYMI 
SDI