Gene NATL1_16741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_16741
Symbol
ID	4779748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1365451
End bp	1366854
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	30%
IMG OID	640084958
Product	hypothetical protein
Protein accession	YP_001015495
Protein GI	124026379
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTTTCAA AAGAAAAAGA ATCTGTGGGA GAACAAGAAG GAAAGAAAAA AGTCACTGAA 
GTAAAAACAT TTCCCATTCC TTTTGCTTTA GAAGAAATAA AAGAAAATAT CACCCTTAAC 
ACCAAGACTA AATCCCAATT GCCTAAAGAA CAAATAATTA ATCAAGCTTT TAAATTTCAT 
TCACAAGGAA ATATTTCAAA GGCAACAAAA TATTATCAGA TTTGTATAAA ACAGGGATTT 
AATAATCCAC AAGTTTTTTC AAATTTTGGG ATTTTATTAA AAGAGATAGA TCAATTAAAA 
GAGGCGGAAA AAATGATTAA ACAAGCTATT AAATTAAAAC CTGATTATGC TATAGCATAT 
AATAACTTGG GAAATATATT AATAGATTTA GGCAGACTAA AAGAGGCAGA AATATATACT 
AAAAAAGCTA TTGACTTAAA ACCTGATTAT GCAAATGCTT ATAATACATT AGGAAATATA 
TTAAAAGAAT TGGACAATTT AAAAGATGCC GAAATTTGCT TTTCAAAGGC AATTTCATTG 
GAGCCAGATC ATGAATCAGC AATTATTAAT AGAGGTCAAT TATATTTTGA TAAAGGAGAA 
TTTAAGAAAG CCTTAAAAGA CTCTGACTTA TGTAATACAA AACAATCTAG AGCATTTTCT 
TTGGAAATTC TTTATTCATT AGGGAGTATC AATGAAATTT ATAATAGAAT TGAAAAGACC 
TATGCATTTG ATGATAAAAA CTTAAGGTTG GCAGCATTCT CTTCATTTAT ATCAGAACGG 
GAAAATAAAT ATACTCATCA TAATTTTTGT CCAAAGCCAC TTAAATTTCT ACATTTCAAC 
AATCTTAAAA ATCAACTTAA CAATTATGAG GAATTTATAA AAGGACTACT TAAAGAATTA 
TCTGAGATTA AAACCGTTTG GGAACCACCA AAAAAAACAA CTCATAATGG ATTTCAAACT 
CCAAGTTATA TAAATTTGTT TTCAGAATCT TCAATAAAAA TTTCAAAACT AAAGGCCATA 
ATCTGTAATG AATTAGATTC TTATTATCTA AAATTCAAAA GAGAGTCTTG TTCTTATATT 
AAAAAATGGC CTTCACATAA AAAGCTTTTG GGATGGCATG TAATCCTGAA GAAGCAAGGA 
TATCAAGAGG CGCACATACA TCCAGCTGGC TGGCTAAGTG GAGTTATTTA TTTAAAGGTT 
GTCCCTTCAC TAGGGAAAGA TGAGGGGGGA ATTGAATTTA GTTTAAATGG GCCGAATTAT 
TCCAATATCA ACTCTCCACA ATTAATTCAT CAACCAGAAG TAGGTGATAT GGTTTTTTTC 
CCCTCTTCAC TTCACCACAG GACTATCCCT TTCTCTACAG ATACAGATCG AATAGTCGTG 
GCTTTTGACT TGATGCCAAA TTGA

Protein sequence

MLSKEKESVG EQEGKKKVTE VKTFPIPFAL EEIKENITLN TKTKSQLPKE QIINQAFKFH 
SQGNISKATK YYQICIKQGF NNPQVFSNFG ILLKEIDQLK EAEKMIKQAI KLKPDYAIAY 
NNLGNILIDL GRLKEAEIYT KKAIDLKPDY ANAYNTLGNI LKELDNLKDA EICFSKAISL 
EPDHESAIIN RGQLYFDKGE FKKALKDSDL CNTKQSRAFS LEILYSLGSI NEIYNRIEKT 
YAFDDKNLRL AAFSSFISER ENKYTHHNFC PKPLKFLHFN NLKNQLNNYE EFIKGLLKEL 
SEIKTVWEPP KKTTHNGFQT PSYINLFSES SIKISKLKAI ICNELDSYYL KFKRESCSYI 
KKWPSHKKLL GWHVILKKQG YQEAHIHPAG WLSGVIYLKV VPSLGKDEGG IEFSLNGPNY 
SNINSPQLIH QPEVGDMVFF PSSLHHRTIP FSTDTDRIVV AFDLMPN