Gene P9303_25641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_25641
Symbol
ID	4778897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2257994
End bp	2259271
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	57%
IMG OID	640088085
Product	glycosyl transferase, group 1
Protein accession	YP_001018560
Protein GI	124024253
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA TGGATGATCT TTGGCTGGTG TTGCCTCATT TGGGGCCGGG TGGTGCCCAA 
AAGGTTGCTC TTCTCGCTGC TGATCACTTC GCGGCTCAGG GGCTAAGCCT GCGTGTTGTG 
ACTTTGCTGC CAGGTCATTC CATTGCCCAT TGCCTCCCTG ATGGACTTGA TCATTGTGAT 
CTAGGGCCTG CTGTCGAAGC CGCTTGGCGC AGGGACTATT GGAACCGATC CCTGGTAGCG 
CGTGGTCGAC GATTCGTGTT CGCTCAGCGG CGACGACTAC ATCGCATCGC CGCAAAACTT 
TTGCTGCTGC TGGTTTGGCC CTGGTTGAGT GGCGAGGCTA AGCCTGGCAG GAATGGCCTT 
GCATCAGGAT TGCTCTGTTG GTGTGTACAC GGGGTTGGTG GGCCTCAGGC ACTGCTGCTT 
CAGGATTTGT TTCGCCAGCA TCAACCTCAG CGGGTCCTGG CGTTTTTAAG TCGTACCAAC 
ATGTTGGTGT GCCAGGCCCT TTGGGATTCT TCGACCCACC TGGTGATTTC TGAGCGCAAT 
GATTTATCGC GTCAGTCGTT GCCTTTCCCC TGGCAGCGGC TACGCAAGGT TCTTTACCAA 
CGTGCCGATG TGGTCACGGC CAATACCGAT GGCGTGCGCC AGTCTCTTGA GTGTTTGCCC 
AATTTGCAAC GCCTAGAACT ATTGCCCAAC CCTCTGCCGA GAAAGGATGA CTCCCTCCAT 
GTTGCCAATG CCGCTGATGG GATACGGCCA GAAGCATTTG TCACCGTGGC CAGGCTGGTT 
CCTCAGAAGG GCATCGATGT CTTGATTCGT GCGCTTGCAC TGATGACTGG CTCGGCCAGT 
CAATGGCCAG TTTTTCTGGT TGGCGATGGC CCGGAACGGC CGGCACTGGA GAGTCAGGCT 
GTAGTCGAGG GTGTCGCCCA ACGTGTGCAT TTTGAGGGCT TCCGCAGTGA TCCAGAGGTA 
CTACTTGCTG CAGCGTCTGT ATTTGTGCTG CCTTCAAGGT TTGAGGGTAT GCCGAATGCT 
CTTTTGGAGG CGATGGCTGC CGGACTTGCT GTGATCGTTA CTGATGCGTC GCCAGGGCCA 
CTGGAGGTTG TCGAACATCG CCGTTCCGGC ATTGTGGTTC CCAACGAGGA CCCCCATGCT 
CTCGCCAAGG CGATGTCGGA ACTGGTTGAA GATGTAGACC TACGGAATCG TCTGGGATTG 
GCAGCACGTG ATCGCCTTGC AGCCCTTGAT TGGCCGCAAG TGGAAACACA GTGGCGCTCG 
GTGCTCGCTC TGCCATGA

Protein sequence

MAKMDDLWLV LPHLGPGGAQ KVALLAADHF AAQGLSLRVV TLLPGHSIAH CLPDGLDHCD 
LGPAVEAAWR RDYWNRSLVA RGRRFVFAQR RRLHRIAAKL LLLLVWPWLS GEAKPGRNGL 
ASGLLCWCVH GVGGPQALLL QDLFRQHQPQ RVLAFLSRTN MLVCQALWDS STHLVISERN 
DLSRQSLPFP WQRLRKVLYQ RADVVTANTD GVRQSLECLP NLQRLELLPN PLPRKDDSLH 
VANAADGIRP EAFVTVARLV PQKGIDVLIR ALALMTGSAS QWPVFLVGDG PERPALESQA 
VVEGVAQRVH FEGFRSDPEV LLAAASVFVL PSRFEGMPNA LLEAMAAGLA VIVTDASPGP 
LEVVEHRRSG IVVPNEDPHA LAKAMSELVE DVDLRNRLGL AARDRLAALD WPQVETQWRS 
VLALP