Gene A9601_02471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02471
Symbol
ID	4716931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	229796
End bp	231649
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	38%
IMG OID	640077946
Product	cell division protein FtsH2
Protein accession	YP_001008642
Protein GI	123967784
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACAAAC GTTGGAGAAA CGTAGGACTT TACGTTCTAG CTGTTATTAC TGTAATTTTC 
ATTGGTACCT CAGTTTTTGA TAAACCTAAT ACTGAAAGTT CTACAAAGAC CTTGAGATAT 
AGTGATTTTA TAGAGGCAGT TCAAGATAAA GAAATCAGTA GAGTCCTAAT ATCTCCAGAT 
AATGCCACAG CTCAAGTTGT TGAAAATGAT GGGAGCAGGT CTGAGGTCAA TTTAGCCCCT 
GACAAAGATT TATTAAAAAT ACTGACTGAG AATAATGTAG ATATAGCTGT AACTCCTACA 
AAATTAGCCA ATCCATGGCA ACAAGCTATA AGTAGCTTAA TTTTTCCAGT ACTTTTGATC 
GGAGGCCTAT TTTTTCTTTT CAGAAGATCC CAAAGCGGTA ATGCTGGAGG TGGTAACCCT 
GCCATGAGTT TTGGTAAAAG CAAAGCTAGA TTGCAAATGG AACCATCTAC ACAAGTAACC 
TTTTCAGATG TTGCAGGTGT TGAAGGGGCA AAATTAGAAC TTACAGAAGT TGTAGATTTT 
CTTAAGAGCC CAGATAGATT TACTGCAGTA GGAGCAAAAA TTCCAAAAGG AGTTCTTCTT 
GTTGGCCCTC CTGGGACAGG AAAAACATTA TTAGCAAAAG CAGTAGCTGG AGAAGCAGGT 
GTACCTTTTT TCTCAATATC TGGTTCAGAA TTTGTAGAGA TGTTTGTAGG AGTTGGAGCT 
AGCAGAGTTA GAGATCTTTT TGAACAAGCT AAAAAGAATG CTCCTTGTAT TGTTTTTATT 
GACGAAATAG ATGCAGTTGG AAGACAAAGG GGTGCTGGTA TGGGCGGAGG AAATGATGAA 
AGAGAGCAAA CATTAAATCA ACTCCTAACT GAAATGGATG GTTTCGAAGG TAATTCAGGA 
ATAATAATAG TTGCTGCCAC CAACAGACCA GATGTCTTAG ATTCAGCTTT AATGCGTCCT 
GGAAGATTCG ATAGACAGGT AACAGTAGAT AGACCAGATT ATGCTGGAAG ATTGCAGATA 
TTAAATGTTC ATGCGAAAGA TAAAACTCTT TCAAAAGACG TAGATTTAGA TAAAGTTGCT 
AGAAGAACAC CAGGATTTAC TGGTGCAGAT TTAGCTAACC TCTTAAATGA AGCAGCAATA 
TTAGCAGCTA GAAAAGATTT AGATAAAGTA AGTAACGATG AAGTCGGTGA TGCCATTGAA 
AGAGTTATGG CTGGCCCAGA AAAGAAAGAT AGAGTCATCA GTGATAAGAA AAAAGAATTA 
GTTGCTTATC ACGAAGCTGG TCATGCACTC GTTGGAGCAT TAATGCCTGA TTATGATCCA 
GTAGCAAAAG TTTCAATTAT TCCAAGAGGT CAAGCTGGAG GTCTAACCTT CTTTACTCCA 
AGTGAAGAAA GAATGGAATC TGGTCTTTAC TCACGTTCTT ACCTTCAAAA TCAAATGGCT 
GTAGCTCTTG GTGGAAGAGT TGCTGAAGAA ATTGTTTATG GAGAAGAAGA AGTAACAACT 
GGAGCTTCAA ATGATTTACA ACAAGTTGCT AATGTAGCAA GACAAATGAT CACTAAATTC 
GGCATGAGTG ACAAAATAGG TCCTGTCGCT CTAGGTCAAT CTCAAGGTGG AATGTTTCTA 
GGAAGAGATA TGAGCTCTAC AAGAGATTTC TCTGAAGACA CGGCCGCAAC AATTGATGTA 
GAGGTTTCAG AACTTGTTGA TGTTGCCTAT AAGAGAGCTA CAAAAGTTTT ATCAGATAAC 
AGAACAGTTC TAGACGAAAT GGCTCAAATG CTAATTGAAA GAGAAACTAT AGATACTGAA 
GATATCCAAG ATTTGCTTAA CCGCTCAGAA GTAAAAGTCG CAAACTATAT TTAA

Protein sequence

MNKRWRNVGL YVLAVITVIF IGTSVFDKPN TESSTKTLRY SDFIEAVQDK EISRVLISPD 
NATAQVVEND GSRSEVNLAP DKDLLKILTE NNVDIAVTPT KLANPWQQAI SSLIFPVLLI 
GGLFFLFRRS QSGNAGGGNP AMSFGKSKAR LQMEPSTQVT FSDVAGVEGA KLELTEVVDF 
LKSPDRFTAV GAKIPKGVLL VGPPGTGKTL LAKAVAGEAG VPFFSISGSE FVEMFVGVGA 
SRVRDLFEQA KKNAPCIVFI DEIDAVGRQR GAGMGGGNDE REQTLNQLLT EMDGFEGNSG 
IIIVAATNRP DVLDSALMRP GRFDRQVTVD RPDYAGRLQI LNVHAKDKTL SKDVDLDKVA 
RRTPGFTGAD LANLLNEAAI LAARKDLDKV SNDEVGDAIE RVMAGPEKKD RVISDKKKEL 
VAYHEAGHAL VGALMPDYDP VAKVSIIPRG QAGGLTFFTP SEERMESGLY SRSYLQNQMA 
VALGGRVAEE IVYGEEEVTT GASNDLQQVA NVARQMITKF GMSDKIGPVA LGQSQGGMFL 
GRDMSSTRDF SEDTAATIDV EVSELVDVAY KRATKVLSDN RTVLDEMAQM LIERETIDTE 
DIQDLLNRSE VKVANYI