Gene NATL1_03061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_03061
Symbol
ID	4780272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	283664
End bp	285511
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	40%
IMG OID	640083571
Product	cell division protein FtsH2
Protein accession	YP_001014135
Protein GI	124025019
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACAAAC GCTGGAGAAA CATTGGTCTT TATGTCCTAA TTGTTGTAGT TGTGATTTTT 
GTTGGAAGTG CTTTTTTCGA TAAGCCAAGC CCAACAAAAT CATCTAGAAC ACTTAGATAT 
AGTGACTTCA TAGAAGCTGT TCAAGAGAAG CAAATAAGCA GGGTTCTTAT TTCTCCAGAT 
AAAGGAACTG CTCAAATTGT TGAAAGTGAT GGGAACAGGG CTTTAGTTAA TTTGGCTCCT 
GATCAACAAT TACTCCAATT ACTTACTGAT AATGACGTCG ATATTGCCGT ACAACCAACT 
ACTCAAGCCA ATCCTTTACA GCAAGCTGCT ACTAGCTTAA TTTTTCCAAT TCTTTTATTA 
GGAGGTCTAT TTTTTCTATT TAGAAGAGCA GGCTCTGGTG GTGGTGGAAA CCCAGCAATG 
AATTTTGGCA AGAGTAAAGC AAGACTTCAA ATGGAGCCTG AAACAAAAGT TACTTTTGGA 
GATGTTGCTG GAATTGAAGG TGCAAAGCTT GAACTTACTG AAGTAGTTGA TTTCTTAAAA 
AATCCTGATC GCTTCACAGC TGTAGGAGCA AAAATTCCTA AAGGTGTTTT ATTAGTTGGA 
CCTCCGGGAA CAGGTAAAAC TTTGCTTGCA AAGGCAGTTG CAGGTGAAGC TTCAGTTCCA 
TTCTTTTCAA TATCTGGATC TGAGTTTGTA GAGATGTTCG TTGGCGTTGG TGCAAGCAGA 
GTCAGAGACC TTTTTGAACA AGCTAAAAAG AATGCTCCTT GTATAGTTTT TATTGATGAA 
ATAGATGCTG TTGGTCGTCA GCGTGGAGCA GGACTTGGAG GAGGTAATGA TGAAAGAGAG 
CAAACGCTAA ACCAATTGCT AACTGAAATG GATGGATTTG AGGGAAACTC AGGAATAATT 
ATTGTTGCAG CTACAAATAG ACCTGATGTG CTCGACTCAG CACTCATGAG ACCAGGAAGA 
TTTGACAGGC AAGTAACTGT TGACAGACCT GATTACTCAG GGAGATTGCA AATACTGCAT 
GTTCATGCAA AAAGTAAAAC ACTTTCAAAG GCAGTTGACC TTGATCAAGT AGCTAGAAGG 
ACACCTGGTT TTACTGGGGC AGATTTAGCA AATCTATTAA ATGAAGCTGC CATATTGGCT 
GCCAGAAGAG AATTAACAGA AGTCAGTAAC GATGAGGTCA GTGATGCAAT CGAGAGAATA 
ATGGTAGGTC CTGAGAAGAA AGACTCAGTG ATTAGTGAAA AACGTAAAAA GTTAGTTGCT 
TATCATGAAG CTGGCCATGC AGTAGTTGGT GCTGTGATGC CTGATTATGA CCCTGTACAA 
AAGATTTCAA TCATTCCAAG AGGTGGAGCT GGAGGATTAA CTTTTTTCAC ACCAAGTGAA 
GAAAGAATGG AATCTGGACT TTATTCAAGG TCTTACCTAC AAAATCAAAT GGCTGTTGCT 
CTTGGCGGAA GAGTTGCTGA AGAAATAATT TATGGAGAAG ACGAAGTAAC CACAGGAGCA 
TCAAATGATC TAAAGCAAGT AGCTTCAGTC GCACGGCAAA TGATTACCAA ATTTGGCATG 
AGTGACAAGT TAGGGCCTGT AGCTTTAGGA CGTTCACAGG GTGGAATGTT CCTTGGTAGA 
GACATCTCTG CAGAAAGAGA TTTTTCTGAA GATACAGCAG CAACAATTGA TTCAGAAGTT 
TCAGTTCTTG TTGAGATTGC ATACGAAAGA GCTAAAAAGG CTTTAAACGA CAATCGCCAA 
GTTCTTGAGG AGTTAACAGC AATGCTTATG GAAACTGAGA CAGTTGATTC TCTAGAGTTC 
CAGGATTTGT TAATTCGCCA TGAAGTTAAA GTTGCTGAAT ATGCTTAG

Protein sequence

MNKRWRNIGL YVLIVVVVIF VGSAFFDKPS PTKSSRTLRY SDFIEAVQEK QISRVLISPD 
KGTAQIVESD GNRALVNLAP DQQLLQLLTD NDVDIAVQPT TQANPLQQAA TSLIFPILLL 
GGLFFLFRRA GSGGGGNPAM NFGKSKARLQ MEPETKVTFG DVAGIEGAKL ELTEVVDFLK 
NPDRFTAVGA KIPKGVLLVG PPGTGKTLLA KAVAGEASVP FFSISGSEFV EMFVGVGASR 
VRDLFEQAKK NAPCIVFIDE IDAVGRQRGA GLGGGNDERE QTLNQLLTEM DGFEGNSGII 
IVAATNRPDV LDSALMRPGR FDRQVTVDRP DYSGRLQILH VHAKSKTLSK AVDLDQVARR 
TPGFTGADLA NLLNEAAILA ARRELTEVSN DEVSDAIERI MVGPEKKDSV ISEKRKKLVA 
YHEAGHAVVG AVMPDYDPVQ KISIIPRGGA GGLTFFTPSE ERMESGLYSR SYLQNQMAVA 
LGGRVAEEII YGEDEVTTGA SNDLKQVASV ARQMITKFGM SDKLGPVALG RSQGGMFLGR 
DISAERDFSE DTAATIDSEV SVLVEIAYER AKKALNDNRQ VLEELTAMLM ETETVDSLEF 
QDLLIRHEVK VAEYA