Gene NATL1_16631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_16631
Symbol
ID	4779751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1355013
End bp	1356098
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	36%
IMG OID	640084946
Product	membrane-associated Zn-dependent proteases 1
Protein accession	YP_001015485
Protein GI	124026369
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.24545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTC TCTTATCTAT AGCTGTACTT GGCCTTCTGA TTTTTTTTCA TGAATCTGGT 
CATTTTTTAG CAGCAGTACT TCAAAAAATT AAAGTCAGTG GATTTTCAAT TGGTTTCGGA 
CCAGCTCTTT TGAAAAAGGA AATAAATGGG ATTACTTATT CACTTAGATC GCTTCCTTTA 
GGTGGATTCG TTTCCTTTCC TGATGAAGAA ACTGATTCAC TAGTTCAACC TAATGACCCA 
GATCTTTTAA AGAATAGACC AATTCACCAA AGAGCAATAG TTATTTCAGC GGGTGTCATA 
GCAAATTTAT TACTTGCTTG GATCGTACTT ATTGGTCAAG CAAGCTTTGT AGGAATTCCT 
AATCAACCTG AGCCAGGAGT AATAATCATG GGAATCCAAC CAGATGAGCC TGCATTTAAT 
TCTGGATTAG TGGCTGGAGA TCGAATAATG AGCGTAAACG GGAAAGAATT AGGAAGCGGT 
AAGGAGGGAA TTATGAATTT AGTCAATATC ATTCAAAATT CATCGGGGGA AGAATTACTT 
TTTGAGAGAG TTAATGAAGA AGCAAACGAT ACAGTTTCTA TAATTCCAGC TGAAAACGAA 
GGAAATGGGA GGATAGGAGC TCAATTGCAA CCAAATCTTA CTAATGAAGT ATCAAAAGCA 
AAAAATATTG GAGAAATATT TAATAGCTCG AATTCACAAT TTTATGAATT ACTAAGTCGA 
ACAGTTATTG GCTATAAAAG CTTGATTACT AATTTCTCTT CAACGGCTCA GCAGTTAAGT 
GGTCCAGTCA AAATTGTTGA AATTGGAGCT CAGCTCTCAG AGCAAGGGGG CTCAGGTCTT 
ATACTATTTT CTGCTTTGGT TTCAATTAAC CTTGCAGTTC TTAACTCGTT ACCGTTGCCA 
CTTCTAGATG GAGGACAACT TGTACTTCTA ATTCTAGAAA GTATCAGAGG GAAGCCTGTT 
CCTGAAAAAA TTCAATTAGC TTTTATGCAA TCAGGATTTG TTTTACTTGT AGGACTAAGT 
GTTGTTTTGA TAATCCGAGA TACTACTCAG CTAGCTTTAG TTCAACAGAT TGTTCACAGA 
CAATAA

Protein sequence

MNVLLSIAVL GLLIFFHESG HFLAAVLQKI KVSGFSIGFG PALLKKEING ITYSLRSLPL 
GGFVSFPDEE TDSLVQPNDP DLLKNRPIHQ RAIVISAGVI ANLLLAWIVL IGQASFVGIP 
NQPEPGVIIM GIQPDEPAFN SGLVAGDRIM SVNGKELGSG KEGIMNLVNI IQNSSGEELL 
FERVNEEAND TVSIIPAENE GNGRIGAQLQ PNLTNEVSKA KNIGEIFNSS NSQFYELLSR 
TVIGYKSLIT NFSSTAQQLS GPVKIVEIGA QLSEQGGSGL ILFSALVSIN LAVLNSLPLP 
LLDGGQLVLL ILESIRGKPV PEKIQLAFMQ SGFVLLVGLS VVLIIRDTTQ LALVQQIVHR 
Q