Gene NATL1_06381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_06381
Symbol
ID	4779339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	578598
End bp	579584
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	36%
IMG OID	640083916
Product	nucleoside-diphosphate-sugar epimerases
Protein accession	YP_001014465
Protein GI	124025349
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0655453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.975907
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAACG AAATAATTCT GATTACTGGA GCAAGTGGAT GTGTTGGGCA ATACATAGCA 
AATTGGCTAA TCGAAAACTC AACTTCAGAA TTATTTTTAT GGGTTAGAGA TCCTAAAAAA 
ATAACTTCAA TAAATTTAGA AAACCCAAGG ATAAAAATTT TAGTCGGAGA TTTGAGAGAA 
TCAAATAAGT TCAAGAAAGA AATTTCAGAA GTCAACAGAG TTATTCATAC TGCGACTGCT 
TGGGGTGATC CTAAAAGGGC GAAAGAAGTC AATATTGATG CAGTAAAAAA TTTGCTCAAT 
TTACTAAATC CCTCCAATAT CAAACAAATT ATTTATTTCT CAACTGCAAG TGTTCTTGAC 
AGAAACTTAA ATTTGTTACC GGAAGCTTTT ACCTATGGAA CAGAGTACAT ACAAACAAAA 
GCACAATGCC TCAGAGAGCT TGAGTCTCAT CAGCTTGCAA CGAAGATCAT AGCTGTTTTC 
CCAACACTAG TTTTTGGCGG ACGTTTAGAC GGTAAAAGTA AATTTCCAAC CAGCTATCTT 
ACCGAAGGAC TTAGAGATGC ATTGAGATGG ATCTGGCTGG CTAGATGGAT AAAATTATCC 
TCAAGGTTTC ATTTTATTCA CGCAGCAGAT ATCGCTTTCA TTTGCGGGCA TCTGGCTACT 
TCTGATTTCG AGCCCATACA ACCTTTTTCT GCCACTAAAA TAAAAAAATT AGTTTTAGGT 
CAACCCTATA CAAGTATTGA TGTAGTAATT CAGACGCTTT TAATATGGAA AGGAATGAGA 
AGAGTCCCTC AAATCCCAGT CTTGAACTGG CTTATTGAAC TTTTAACTGT ATTACTACCA 
ATTCAAATGA CAAACTGGGA TAGATTTAGT CTTAGACAAA AACACTTTAT ACATGAGCCC 
GTAACCTCTC CTGAAACCTT CGGGGGTATA AGTCATGCCA AAACGCTAAG TCAAGTTTTA 
CATAATTCTG GTTTAACTAA ACACTAA

Protein sequence

MKNEIILITG ASGCVGQYIA NWLIENSTSE LFLWVRDPKK ITSINLENPR IKILVGDLRE 
SNKFKKEISE VNRVIHTATA WGDPKRAKEV NIDAVKNLLN LLNPSNIKQI IYFSTASVLD 
RNLNLLPEAF TYGTEYIQTK AQCLRELESH QLATKIIAVF PTLVFGGRLD GKSKFPTSYL 
TEGLRDALRW IWLARWIKLS SRFHFIHAAD IAFICGHLAT SDFEPIQPFS ATKIKKLVLG 
QPYTSIDVVI QTLLIWKGMR RVPQIPVLNW LIELLTVLLP IQMTNWDRFS LRQKHFIHEP 
VTSPETFGGI SHAKTLSQVL HNSGLTKH