Gene P9303_00631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_00631
Symbol
ID	4776366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	58653
End bp	59984
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	640085563
Product	glycosyl transferase family protein
Protein accession	YP_001016085
Protein GI	124021778
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCCG CCGCTGTCAT TGGGGATCAT CGACGCGGCA AGACAGCCCT GTTTTTGATT 
GCTTGCGGTT GGGCTGGTGC AGCACCCCAC CTTTGGCTGG AAGCAAGTAG AAGTCTTTTG 
CCTGCAATTA CGCTGGCTTT TGTCTTGGGA GGGTATGGCC TGCGCACGGT TTTGCGCGAT 
CGGCAGCACT CGTCTGCCAA TGCCAATGAA ATAGGGCTTG AGCCCTCTGC TGAGTATGTC 
TGGCCCAGTG TTGATGTTTT GGTCGCTGCC AGGGATGAGG AAGCTGTCGT TGATCGGTTG 
GTGGAACGTC TTGCCGGTCT GAACTATCCC AAGGGCAAGC TGTCTACTTG GATTATTGAT 
GATGGTAGTC AGGACCGAAC GCCAGCTCTA CTGGATGAGT TGCAGCAGCA GTTTCCTTCT 
TTAAACGTGA TTCATCGTCC TTCTGGAGCA GGCGGCGGAA AGTCTGGAGC TCTTAATGCA 
GCACTCCAGC AGCTTCAGGG GGAATGGCTC TTGATTCTTG ATGCTGATGC CCAGTTGCAG 
GATGACCTGC TCCAGCGTCT GGTGTTATTT GCCCAACAGG GTGGGTGGTC TGCTGTGCAG 
TTGCGTAAGG CGGTGATCAA CTCTCAGCAC AATCTGCTCA CCAGGGTTCA GGCGATGGAG 
ATGGCTATGG ATGCCTTGAT TCAACAAGGA CGCTTAGCGG GGGGAGGCGT GGTAGAGCTG 
CGTGGAAATG GCCAGTTGAT TCAACGCTCC ACGCTGGAGG CTTGTGGGGG ATTCAATGAA 
AATACGGTCA CAGATGATCT TGATCTGAGT TTCCGTTTAC TTACAGCTGG AGCTTTGGTC 
GGGATTGTCT GGAACCCTCC AGTGCAGGAG GAGGCAGTGG AGAGCTTGTC AGCTCTTTGG 
AGACAACGAC AACGTTGGGC CGAGGGTGGA TTGCAGCGAT TTTTTGACTA CTGGCCAGTC 
TTGATGTCCA GCAAGTTAAC TCTGGCTCAG CGTCGTGATT TGGCTTGTTT TTTCCTCCTT 
CAATACGCCC TCCCAGTGGT GTCTTTCGCT GATCTGTTCA CCACATTATT GACACGCACT 
ATCCCAACCT ATTGGCCTCT TTCGATCGTG GCCTTCAGCA TTTCAGGGAT GGCTTACTGG 
CGCGGTTGTA GGAGCATCAG TGATGGGCCT GCTTTGCCAT CGCCAACCCC GTGGAATCTT 
GTGGTGGCGA TTACTTATTT GTCTCACTGG TTTGTGGTCA TCCCTTGGGT CACAGTACGG 
ATGGCACTGT TCCCGAAGAG TTTGGTGTGG GCCAAGACCA GTCATCATGG CCAACAGCCT 
GTTCAGGTTT GA

Protein sequence

MAAAAVIGDH RRGKTALFLI ACGWAGAAPH LWLEASRSLL PAITLAFVLG GYGLRTVLRD 
RQHSSANANE IGLEPSAEYV WPSVDVLVAA RDEEAVVDRL VERLAGLNYP KGKLSTWIID 
DGSQDRTPAL LDELQQQFPS LNVIHRPSGA GGGKSGALNA ALQQLQGEWL LILDADAQLQ 
DDLLQRLVLF AQQGGWSAVQ LRKAVINSQH NLLTRVQAME MAMDALIQQG RLAGGGVVEL 
RGNGQLIQRS TLEACGGFNE NTVTDDLDLS FRLLTAGALV GIVWNPPVQE EAVESLSALW 
RQRQRWAEGG LQRFFDYWPV LMSSKLTLAQ RRDLACFFLL QYALPVVSFA DLFTTLLTRT 
IPTYWPLSIV AFSISGMAYW RGCRSISDGP ALPSPTPWNL VVAITYLSHW FVVIPWVTVR 
MALFPKSLVW AKTSHHGQQP VQV