Gene A9601_13921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_13921
Symbol
ID	4718113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1160134
End bp	1161261
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	23%
IMG OID	640079113
Product	putative glycosyl transferase, group 1
Protein accession	YP_001009783
Protein GI	123968925
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.69221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATATG CTGAAGAACC TCATACTGGT CTAACTAGGT TTACTGTAAA CATTTTTAAA 
AATTTAATCA AAAATTCATC TAAAAACTAT TTTTATTATT TATTACTTCC TCCTAAAGAA 
TGCAGTAAAC ATTTTATTGA TGACTTTCCC TCTGATTTAA AAAACTTTAA AAAAATATTT 
TGGAGACAAA AAAGAGGATT AAAATGGAAA ATACCATTTG TTTTATTTGA TTTAGATATT 
TTATTATTAG TTAAAGAAAT TAAACCTAAT TTATTCATAT CTCCTTATAT TGATCCTCCA 
TTTATTCCAT TTGTAAAAGT TATCGCAACT ATTCATGATT TAATATTTAT TGAAGTAAAA 
GATTATTTTC AGCACTTATC TCTATTAAAA AGATTAGTTG CATATTTTAG AATATTAATA 
ACGATATTAA TTTGTGATAA TTTATTAGTG GTCTCATCTG CCACGAAAAA AAAATTAATT 
AATAGATTTA ATTGGATCCC AAATAGCTTT AAAAGTAAGA TTAAAAATGC AAGTATTATT 
TCTAATGGAA TAGACTTGTT AAGTTTAGAT AAAAAAAAAT ATGTTGAAAT TAAAGAGTTA 
ATTAACAAAG ATTTCTTTCT CTATGTAGGA GATAGAAGAC CCCATAAAAA TATTATTTAC 
TTAATTAAAC TAGTCAAAGC TATTAATAAA AAATTTTCTA AAAATACTAT TTTAATTTTA 
GCTGGATCAA ATAAGTATAA GAATTTAAAG CTTAATAAAT TAATTACTAA AAATAATTCC 
TTAGTTCATG AGATTGTAAA TCCTTCAGAT TTAACATTAG ATTTCCTTTA CAGGAACTGT 
AAATCATTTT TCTTGATTTC AAAAGAAGAA GGATTTGGTA TACCAGTCAT TGAAGCTGCA 
AGTAGAGGCG CTAAGATTGT AATAAGTAAT ATTCCTGCTT TAAGAGAAAT ATCGCCCAAG 
CATTCATGTA TTATTAATTT ACGAGAAATT ACTGAAGATG TTAATAAGAT TTCATGTTAT 
TTGAAAAATG ATCTAAGACC AAATTCAAAA GAAGTTATCA AAAAATGGAG CTGGCAAAAT 
TCCTCTAAAA ATTTGTTTGA ATTAATAAAA ATTGTTTTAG AATCTTAA

Protein sequence

MRYAEEPHTG LTRFTVNIFK NLIKNSSKNY FYYLLLPPKE CSKHFIDDFP SDLKNFKKIF 
WRQKRGLKWK IPFVLFDLDI LLLVKEIKPN LFISPYIDPP FIPFVKVIAT IHDLIFIEVK 
DYFQHLSLLK RLVAYFRILI TILICDNLLV VSSATKKKLI NRFNWIPNSF KSKIKNASII 
SNGIDLLSLD KKKYVEIKEL INKDFFLYVG DRRPHKNIIY LIKLVKAINK KFSKNTILIL 
AGSNKYKNLK LNKLITKNNS LVHEIVNPSD LTLDFLYRNC KSFFLISKEE GFGIPVIEAA 
SRGAKIVISN IPALREISPK HSCIINLREI TEDVNKISCY LKNDLRPNSK EVIKKWSWQN 
SSKNLFELIK IVLES