Gene A9601_19201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_19201
Symbol
ID	4718660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1659862
End bp	1661271
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	31%
IMG OID	640079655
Product	sucrose phosphate synthase
Protein accession	YP_001010309
Protein GI	123969452
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR02472] sucrose-phosphate synthase, putative, glycosyltransferase domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.8791
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGTTGA AATTTTTACA TTTACATTTA CATGGTCTTA TACGTTCTAA AAATCTTGAA 
TTAGGCAGGG ATGCAGATAC AGGAGGGCAA ACAAAATACG TTTTAGAGTT AATTAAAAGC 
TTGGCTAATA CTTCAGAAGT GGATCAAGTG GATTTAGTTA CTCGTTTAAT AAAAGACCCT 
AAAGTCGATG ATGAATATTC TCAAGAAGAA GAATTTGTAG AACCTGGAGT TAGAATTTTA 
AGATTCAAAT TTGGACCCAA TAAATATTTA AGAAAGGAAT TGCTTTGGCC TTATTTAGAT 
CATTTAACTG AAACCCTAAT TTCTTACTAT AAAAAAAGCA AAAAGCCTAA TTTCATCCAT 
GCTCATTATG CAGATGCTGG ATATGTAGGA GTTAAACTAA GTAAATCTTT AAACGTTCCT 
CTTATTTTTA CAGGTCATTC TTTAGGAAGA GAAAAAAAAA GGAAATTGCT TGATACTGGT 
TTAAAAACTA ATCAAATAGA AAAACTTTAT TTTATTAGCA AAAGAATTGA GGCAGAAGAA 
AAAGCATTGA AGTCTGCAGA TATTGTTGTT ACAAGCACTA AACAAGAGTC AGTGTATCAA 
TATTCCCAAT ATTCTTCTTT TTCACCTCAC AAAGCTAAAG TTATTCCTCC TGGTGTTGAC 
CATAAAAAAT TTCATCATAT TCACTCCACA AGCGAGACAG TCGAAATTGA TAATATGATG 
AAACCTTTTC TAAAGGATTC TACTAAACCT CCATTTTTGA CTATTTCTAG AGCTGTACGA 
AGAAAAAATA TCCCATCTTT GATTGAGGCA TATGGAAGAT CTGAAAAATT AAAAAGAAAA 
ACTAATTTAA TTCTGATTTT GGGTTGTAGA GATAGTCCTT CAAAACTTGA TCCTCAACAA 
AAAGATGTTT TCAATAATAT TTTTGAAATA ATTGATAAAT ATAATTTGTA TGGAAAGGTA 
GCTTATCCAA AAAAACATCT TCCAAGTCAG ATTCCTGCTT TATATAGGTG GGCTGCTAGC 
AGAGGGGGTG TATTTGTAAA TCCAGCTTTA ACAGAGCCTT TTGGTTTAAC TCTTCTTGAA 
GCTTCTTCCT GTGGATTACC AATAATATCA ACAAATGATG GAGGGCCAAA AGAAATTCGT 
TCAAAATGTG AAAATGGACT TCTAGTAGAT GTTACTGATA TTAATGAGTT AAAAGTTATT 
CTTGAAAAAG GAATTTCAAA TAATAATCGG TGGAAATTAT GGAGCAGAAA CGGAATTGAG 
GGTGTTAGCA GGCACTTTAG TTGGAACACT CATGTACGCA ATTATTTATC AGTACTAACT 
GAAGAATTTT TAAGTTCAAA TAGTTATTCT TCATCTGACA TTAAACAAAG TTGTTTAAAA 
GGAACTTCCT CACTTATAAA ACCCCATTGA

Protein sequence

MRLKFLHLHL HGLIRSKNLE LGRDADTGGQ TKYVLELIKS LANTSEVDQV DLVTRLIKDP 
KVDDEYSQEE EFVEPGVRIL RFKFGPNKYL RKELLWPYLD HLTETLISYY KKSKKPNFIH 
AHYADAGYVG VKLSKSLNVP LIFTGHSLGR EKKRKLLDTG LKTNQIEKLY FISKRIEAEE 
KALKSADIVV TSTKQESVYQ YSQYSSFSPH KAKVIPPGVD HKKFHHIHST SETVEIDNMM 
KPFLKDSTKP PFLTISRAVR RKNIPSLIEA YGRSEKLKRK TNLILILGCR DSPSKLDPQQ 
KDVFNNIFEI IDKYNLYGKV AYPKKHLPSQ IPALYRWAAS RGGVFVNPAL TEPFGLTLLE 
ASSCGLPIIS TNDGGPKEIR SKCENGLLVD VTDINELKVI LEKGISNNNR WKLWSRNGIE 
GVSRHFSWNT HVRNYLSVLT EEFLSSNSYS SSDIKQSCLK GTSSLIKPH