Gene P9301_04171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_04171
Symbol
ID	4911596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	362657
End bp	363823
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	33%
IMG OID	640159995
Product	putative glycosyl transferase, group 1
Protein accession	YP_001090641
Protein GI	126695755
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.116045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTTCATA TTGCCTGGTT AGGGAAAAAA TCCCCTTTTT GTGGAAATGT AACTTACGGT 
AATTCAACTA CTAAGGAATT AAAGGCCAGA GGGCATAAAA TTAGTTTTAT TCATTTCGAC 
AATCCCTCTA GTTCAAATTC ATCAAACCCA TTATTTCTTG CAAATGATCC TGATGTAAGT 
CTCCCGTATT TAATTAAATC TCAAGTTTAT ACAATACCCT CGCCAAGGGC AGAAAAAGAG 
CTAAGGCTAT CATTGGAAAG ATTAAAACCT GACATAGTAC ATGCAAGCCT AACTTTATCT 
CCTTTAGACT TTAGACTTCC AGAGCTTTGT AATGAAATTA ATGTTCCTCT TATAGGAACA 
TTTCATCCAC CATTTGATGC AAAAAATAGA AATCTAACTG CGAGCACTCA ACAATTAACA 
TATCAACTTT ATGCTCCCTC TTTAGCAAAG TTCGATAAAA TAATTATTTT TTCTGAACCT 
CAAAAAAATG TTCTTGAGAA ATTAGGAGTA CCTAAAGAAA AACAAATAAT TATTCCAAAC 
GGCGTTGATG AAAATATTTG GAAACCTTTT TACGAAAAAA GTAAAAAATA TGCTCAAGTA 
AAAAACAAAC TTGGAAACGA AAGAATCTTT TTATATATGG GAAGGATTGC AAATGAGAAA 
AATATTGAGG CACTTTTAAG ATCTTGGCGC CAAACAAAAA CTCATAATTG CAAATTAGTT 
ATTGTTGGTG ATGGACCAAT GAAGCCAACA CTTCAAAATA GTTTTTCTAA CCTGGGTAAT 
GAGAAATTAA TTTGGTGGGG TGCCGAATTA GATTTAGAAA CTAGGATAGC AATAATGCAA 
ATAGCAGAGG TGTTTTTCTT ACCAAGCTTA GTAGAAGGTT TATCATTATC ACTTTTAGAG 
GCAATGTCTG CTGGTACAGC TTGTGTAGCT ACCGATGCCG GAGCTGATGG CGAAGTTTTA 
GATAAAGGAG CAGGAATAGT AATTTCAACT GATAATGTGG CTGCACAATT GAAAACTATA 
ATCCCAATTC TTGTGGAACA TCCGTCATTT ACAAAAGATC TTGGTGAAAA AGCTAGAGAA 
CGAGTACTTG AGAGATATAC AATTACTAAA AATATAAATT CACTTGAAAA AGTTTATACA 
AACTTAAAAG ATAATTATAA AACCTAA

Protein sequence

MVHIAWLGKK SPFCGNVTYG NSTTKELKAR GHKISFIHFD NPSSSNSSNP LFLANDPDVS 
LPYLIKSQVY TIPSPRAEKE LRLSLERLKP DIVHASLTLS PLDFRLPELC NEINVPLIGT 
FHPPFDAKNR NLTASTQQLT YQLYAPSLAK FDKIIIFSEP QKNVLEKLGV PKEKQIIIPN 
GVDENIWKPF YEKSKKYAQV KNKLGNERIF LYMGRIANEK NIEALLRSWR QTKTHNCKLV 
IVGDGPMKPT LQNSFSNLGN EKLIWWGAEL DLETRIAIMQ IAEVFFLPSL VEGLSLSLLE 
AMSAGTACVA TDAGADGEVL DKGAGIVIST DNVAAQLKTI IPILVEHPSF TKDLGEKARE 
RVLERYTITK NINSLEKVYT NLKDNYKT