Gene NATL1_17391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_17391
Symbol
ID	4781269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1424368
End bp	1425591
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	37%
IMG OID	640085026
Product	glycosyltransferase
Protein accession	YP_001015559
Protein GI	124026444
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCGTAA ATTCATCTTT AGATCTTCCA AGCAATATTG CATTAGTACA TGAGTGGTTT 
ACTCCAAGAT CGACAGGAGG TGCTGAGAAT GTTGTTCAGG TGATTGATGA TTTGTTATCT 
GAAATTGCAT CGCAGCCAGA ACTGTTTTCT TTGGTTAATG AAGAGAGGTT AGAAAAAAAT 
AGCTGGTTAT TTGATCGAAA AGTACATACT AGCTTTATTC AAAATTTACC ATTCGGGATC 
TCACATGTTC AACAATATTT ACCCCTTTTG CCTTTTGCAA TTGAGCAACT CGATTTTGAG 
GGATATCCAT TGATTTTAAG CAGTAATCAT CTTGTCGCTA AGGGAATTTT GACATCGCCT 
GATCAACTTC ATATTAGTTA TGTCCATACA CCTGTTAGAT ACGCTTGGGA TCAAATGAAT 
ATATATTTGA AAAGATCTTT TTTAAGAAAA ATTGGTTTAG GGCCGATAAT TAGATGGCAA 
TTGCATACTT TGAGGCAATG GGATCAATTA AGTAGCTCAA GAGTAGATTA TCTGTTGGCC 
AATTCTAATT TTACGGCAAA AAGGATTTGG AAGTATTGGA GAAGGCGTTC AGAGGTTCTG 
CATCCACCTG TTGATGTAAA TCGTTTTGAA TGGAATAGGC CTAGGGAAGA TTTCTATTTA 
AGTGTCTGTA GATTGGTTCC TAATAAAAGG GTTGATTTAC TTGTTAGGGC TTTTAATAGG 
CTTAAATTGC CTTTAATAGT TGTTGGCGAC GGAGTGGAAA AGGAATATTT AAAAAAACTT 
GCAGGTCCAA CTGTTCAAAT TATTGGTTTT CAAAGCAAAG AGAAGATTGA AAGTCTAATG 
AGCAGATGTA GAGCCTTTGT CTATGCTGGT ATTGAGGATT TTGGAATAGC TCCTGTGGAG 
GCAATGGCCT CAGGTGCTCC TGTGATTGCT TTTGGTAAGG GAGGGGTTTT AGATACAGTT 
AAATGTTTTC ATTCTGATTC TGATAAAGGA GCAACTGGCC TTTTGTTCCC TTCTCAGACA 
GTAAAGTCCC TGGTTGAAGC AATCGAATTT TTCAAGCAAA AGCAACTTTG GAGAGATTTA 
AAACCTGAGT TCATTAGAGA TTGGAGCAAT TCTTTTTCTC AAGATTCTTT TAAAGATAAA 
TTTGCCAAAA CCATAAATAG AGCTTGGAGG GAGCATGTCA ATTCTTGTGA CATTGCTACT 
AGTGACCTTA CTTCTTCATC ATAA

Protein sequence

MSVNSSLDLP SNIALVHEWF TPRSTGGAEN VVQVIDDLLS EIASQPELFS LVNEERLEKN 
SWLFDRKVHT SFIQNLPFGI SHVQQYLPLL PFAIEQLDFE GYPLILSSNH LVAKGILTSP 
DQLHISYVHT PVRYAWDQMN IYLKRSFLRK IGLGPIIRWQ LHTLRQWDQL SSSRVDYLLA 
NSNFTAKRIW KYWRRRSEVL HPPVDVNRFE WNRPREDFYL SVCRLVPNKR VDLLVRAFNR 
LKLPLIVVGD GVEKEYLKKL AGPTVQIIGF QSKEKIESLM SRCRAFVYAG IEDFGIAPVE 
AMASGAPVIA FGKGGVLDTV KCFHSDSDKG ATGLLFPSQT VKSLVEAIEF FKQKQLWRDL 
KPEFIRDWSN SFSQDSFKDK FAKTINRAWR EHVNSCDIAT SDLTSSS