Gene NATL1_15401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15401
Symbol
ID	4779652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1253877
End bp	1255472
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	33%
IMG OID	640084822
Product	putative dienelactone hydrolase
Protein accession	YP_001015362
Protein GI	124026246
COG category	[R] General function prediction only
COG ID	[COG4188] Predicted dienelactone hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGAACAA ATTCATTCAT TAAAAAATTA GTTGTTCTTG GAACAGTTGG AAGCTTACTA 
GCTCCTTATT GTTTTTATCC AAAACTTCAA GCAGCAGAGA GATTTGAAAT TCATTTCGAT 
GGAATGTCCA TCCCAATTTC GATAAAAGAA TTGATTGATT GGAGTAATGG TGAAGAGGAA 
AAAAATTCTG AATTAGCTAG TTGGCTTAAT TTACTTGGCT TTAAGGAAAG GAAAGGTTTG 
GCAAAGTTTT TAAGTACACC GTTGGTAAGA GATAAAAGTA TGGCAAGACA AATTTTGAGA 
AGTTGGTCAG GACGAAAATT GCTTGATGAA GTAAGTGATC TAATACTTAT GGATGAAGAC 
AGCTCAGGCG AAAGTGTTCT CGATACTCTA GAAAAACTTT TAAATGAAAA AGATGAGGTG 
ACAACTTTTG ATCTTTTAAA TGCTCTCTCT GTTAAAGCAA TTCACATTGA TTTGGATGGG 
TGGATTGAAG TAGCTAATAA TTGGAGAAGT GAGTTAAACA AACAACAGAA ACTCATAACT 
GATTTAGTGT CAATTAATGA TTTATCAGTT ACCAGAGAGA CAATGAATGT TTTACCTCTT 
GAAATAAAAG AAACCGAATA TGAATTAATT TCCTTAACTG TTTCTCATCG AAAAGAGCCT 
TTAATTTTAG AGGTTTGGAA CCCATCTTTT AGGAAAAAAA ATAGAAAAAA TTGGGTTCTT 
TTAATGCCTG GTTTAGGAGG AGATCGTAAT CATTTTAATT GGCTTGCAAG AAGTCTTAGT 
CACAATGGTT GGCCTGTTGT TGTCTTGGAT CATCCAGGTA GTGACTCATT AGCATTGGAA 
GCCTTGGTAA AAGGAAGACT ACCTTTACCA GGTGCTGAAA TAATTCCTGA ACGTTTGAAC 
GATATCCATA GCATCCTCAA GGCAAAAAAA TCAGGAACAA TTGATTTATT GGCAGAGAAT 
GTTGTCTTGA TGGGGCATTC GTTAGGAGCC CTCACAGCTA TTTTGGCTTC AGGAGTAAAA 
ATAGATGATC AACTTGAAAA TAGATGTCAG GAGGTACTTG ATAATCTTTC TCTTTCTAAT 
TTATCTTCAC TTTTACAATG TCAACTAATA GATATTACTT TGTCAGATAC TAATGGTATA 
GAAAATCTTT CAGCTATTGT TGGTATGAAT AGTTTTGGGA GTTTTTTGTG GCCAAATAAT 
TTAGAAAAAA AAATAAATAT TCCTCTTTTC CTTACAGGAG GAACTTTTGA TTTAGTTACT 
CCTTCTATTA GTGAACAACT AGGATTAATG CTTGCTTTGA GTTCAAGCCC ATTAAGTAGA 
GTCCTTTTAA TTGAGAGAGC TAGCCATTTT TCACCTATTA GAGTAGAGGG ACAAATGAAT 
CAGTCTAAAG GTAAGGATTT ATTTAATCTA GGAGAATCAA TAGTTGGATA TCATCCACTT 
TCTGTTCAGA GCTTATTAGC TTTTGAGATC ATCAACTTCC TAGAAAAATT AGAAGAGAAT 
AAAACAGTCC CTTTGAATAC GAATTTAACT AAAGGCGAGC TTAAGTTTCA TATCTTAGAC 
AGTAATATAA TTGAACAACT TATCAATATT CAATAA

Protein sequence

MRTNSFIKKL VVLGTVGSLL APYCFYPKLQ AAERFEIHFD GMSIPISIKE LIDWSNGEEE 
KNSELASWLN LLGFKERKGL AKFLSTPLVR DKSMARQILR SWSGRKLLDE VSDLILMDED 
SSGESVLDTL EKLLNEKDEV TTFDLLNALS VKAIHIDLDG WIEVANNWRS ELNKQQKLIT 
DLVSINDLSV TRETMNVLPL EIKETEYELI SLTVSHRKEP LILEVWNPSF RKKNRKNWVL 
LMPGLGGDRN HFNWLARSLS HNGWPVVVLD HPGSDSLALE ALVKGRLPLP GAEIIPERLN 
DIHSILKAKK SGTIDLLAEN VVLMGHSLGA LTAILASGVK IDDQLENRCQ EVLDNLSLSN 
LSSLLQCQLI DITLSDTNGI ENLSAIVGMN SFGSFLWPNN LEKKINIPLF LTGGTFDLVT 
PSISEQLGLM LALSSSPLSR VLLIERASHF SPIRVEGQMN QSKGKDLFNL GESIVGYHPL 
SVQSLLAFEI INFLEKLEEN KTVPLNTNLT KGELKFHILD SNIIEQLINI Q