Gene NATL1_16521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_16521
Symbol
ID	4780947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1345823
End bp	1346932
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	33%
IMG OID	640084935
Product	glycosyl transferases group 1
Protein accession	YP_001015474
Protein GI	124026358
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.524889
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAAAAA AGCAATTAAA ACTTATTCTT GTAAGTACAC CTATAGGTTA TCTAGGCAGT 
GGCAAAGGTG GAGGAGTTGA ACTTACTATT GTTTCTCTTA TAAAAGGATT AATTTCATTG 
GGTCATAAAA TTATTTTAAT TGCACCAAAA GGATCAAAAT TACCTTTCGA AAGTGAGTTC 
CTTGAAATAA GATTAATAGA TGGAGTTGAT CAACCTAGTT GGCAGCATCA GAATAGAAAA 
GATCCAGTTT TAATTCCTTC TAAAAGTGTC TTACCAAAAT TATGGGAAGA GGTGATTGAT 
ATCGCAAATG AATCCGACGC AGTTATTAAT TTTGCATATG ATTGGCTTCC ATTATGGTTA 
ACAAAAACAC AATCAATTAA AATATTTCAC TTAATTAGTA TGGGCGCTGA ATCAATAGTA 
ATGAAAGAAA TTATTAGTGA AATAAGTGAA TTATCTCCTT TTCGGCTGGC TTTTCATACT 
AAAAGACAAT CTAAAGATTA TTTTTTAAAA ACTGATCCAA TTATCGTTGG AAATGGTTTT 
GATACTGATG ACTATTTATT CAATAAAAAT GAGAATGGAC CATTAGGTTG GGCTGGAAGA 
ATCGCGCCAG AGAAAGGCTT AGAAGATGCA GTAAAAGTTG CGAATAATTT GGGTGAAAAA 
TTATTAGTTT GGGGACTCAT AGAAGATAAA GAATATGCAT TAAAAATTGA AAATACCTTC 
ACAAAAAAAA TTATTGAATG GAAAGGATTT CTTCCAACGA AGAAATTTCA GGAACAACTA 
GGACGATGTA GAGCGTTGAT AAACACGCCT AAATGGAATG AAGCCTACGG CAACGTTATT 
GTTGAAGCGA TGGCTTGTGG TGTTCCTGTA ATTGCATATG ATCTGGGAGG ACCAGGGGAA 
TTGATCGAAG ATGGATTCAA TGGCTTTTTG GTTAAACCCA ATGATATTGA AGGATTGATG 
AAAGCAACAA AATCAATCTC AGAAATCAAA AGAAAAAATT GTAGAGCTTG GTTTGAAAAA 
AAAGCCACTA GCAAAGTCTT TGCAGAAAGA GTGGAGAATT GGCTTTATAA AGGCTTAAAT 
AAGAAAATCT CAGCAGACTT TAAAGATTAA

Protein sequence

MIKKQLKLIL VSTPIGYLGS GKGGGVELTI VSLIKGLISL GHKIILIAPK GSKLPFESEF 
LEIRLIDGVD QPSWQHQNRK DPVLIPSKSV LPKLWEEVID IANESDAVIN FAYDWLPLWL 
TKTQSIKIFH LISMGAESIV MKEIISEISE LSPFRLAFHT KRQSKDYFLK TDPIIVGNGF 
DTDDYLFNKN ENGPLGWAGR IAPEKGLEDA VKVANNLGEK LLVWGLIEDK EYALKIENTF 
TKKIIEWKGF LPTKKFQEQL GRCRALINTP KWNEAYGNVI VEAMACGVPV IAYDLGGPGE 
LIEDGFNGFL VKPNDIEGLM KATKSISEIK RKNCRAWFEK KATSKVFAER VENWLYKGLN 
KKISADFKD