Gene A9601_14001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14001
Symbol
ID	4718121
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1169702
End bp	1170670
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	28%
IMG OID	640079121
Product	putative fucose synthetase
Protein accession	YP_001009791
Protein GI	123968933
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.881279
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TAATTACCAA AGAAGATAAA ATATTTATTG CTGGTCATAA AGGAATGGTT 
GGTAGGTCAA TTAAAAAAAA TTTAATTTCT AAGAATTACA CTAATTTAAT TACTGTAGAA 
AAGAATGATT TAAATTTATT AGATGATTTA AAAGTAAAGA ATTGGTTTAA AAAAAACAAA 
CCTGATATTG TAATACTCGC GGCAGCAAAA GTTGGCGGGA TTATGGCTAA TAATAAATAC 
CCTGCAAACT TTATTCTGGA AAATCTTAAA ATTCAAACAA ATGTTATAGA AGCATCTTGG 
GAAAATAATA TAAAAAGATT TTTATTTCTA GGAAGTAGTT GTATCTATCC AAAATACGCT 
AATCAGCCAA TTAATGAAGA GGAATTATTA AACGGATATT TAGAACCTAC AAATCAATGG 
TATGCAATTG CAAAAATTGC AGGAATTAAA TTATGTGAAG CACTAAGAAA GCAATATGAT 
TTTGATGCCA TAAGTTTAAT GCCTACAAAT TTATATGGAC CAGGGGATAA CTATGATCCA 
AACAATAGTC ATGTACTTCC ATCTCTAATA AGAAAATTTT ATGAAGCCAA AATAAATAAT 
TTGGATAAAG TAATTTGCTG GGGTACTGGT TATCCGATGA GAGAGTTTCT GCATGTAGAT 
GATCTTAGCG AAGCATCTAT TTATGCTTTA GAAAATTGGT ATCCTAAAAA AGAGGAGTTA 
AAATATATGA ATGTTGGAAC TGGTAAGGAT ATAAGTATTA GAGAATTAGC AACTATAATC 
GCAAAAGAAA TTGGTTTCGA AGGGGAAATA GAATGGGATG TTTCTAAACC TGATGGAACG 
CCAAAAAAAC AATTAAATAT TTCAAAATTC AGCAAATTAG GATGGTCCTC AAAAATAAAA 
CTTTCAGATG GAATTAAAAA TACAATTGAT TGCTACATTA ATGAAAATAA AAAAATAAAT 
AATATTTAA

Protein sequence

MKKLITKEDK IFIAGHKGMV GRSIKKNLIS KNYTNLITVE KNDLNLLDDL KVKNWFKKNK 
PDIVILAAAK VGGIMANNKY PANFILENLK IQTNVIEASW ENNIKRFLFL GSSCIYPKYA 
NQPINEEELL NGYLEPTNQW YAIAKIAGIK LCEALRKQYD FDAISLMPTN LYGPGDNYDP 
NNSHVLPSLI RKFYEAKINN LDKVICWGTG YPMREFLHVD DLSEASIYAL ENWYPKKEEL 
KYMNVGTGKD ISIRELATII AKEIGFEGEI EWDVSKPDGT PKKQLNISKF SKLGWSSKIK 
LSDGIKNTID CYINENKKIN NI