Gene P9211_17381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_17381
Symbol
ID	5730913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	1565305
End bp	1566486
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	42%
IMG OID	641286123
Product	zinc metallopeptidase
Protein accession	YP_001551623
Protein GI	159904279
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.467436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTTT CAGATTGTCA CAAGGAATCT TTGAGGCTGT TTTTGCCTGA ATTGATAACT 
ATCAGAAGGC ATTTACATGC TCATCCAGAA TTAAGTGGTC AAGAGCATCA GACTGCAGCA 
ACTGTTGCGG GGGAATTAAA GAAATATGGT TGGGATGTCA CAGAAGGAGT TGGTCGAACA 
GGTGTTATTG CAGAGTTAGG AGATAAATCT GCTCCTTGTG TTGGATTAAG AGTGGATATG 
GATGCACTCC CCGTAGAAGA GAAAACTGGG TTGCCTTTTT CTTCTTTCAA TCAAGGAGTT 
ATGCATGCCT GTGGGCATGA TCTACATACT TGTATAGGGC TAGGTGTCGC AAAACTTTTG 
GCAGAAGATA AGAGTAAATT GTCAGGTGTA AGACTTTTAT TCCAACCTGC TGAAGAAATT 
GCCTCTGGAG CAAAATGGAT GAAGGAGGAT GGTGCCTTAA CTGGCTTAGA TGCTCTTTTT 
GGTGTTCACG TATTTCCTGA AATACCTGTT GGCCAAATAG GTGTTCGCAG AGGTGTTTTG 
ACCGCAGCCG CAGGTGAGTT ACAAGTTGAG ATCTTGGGGA ATGGAGGACA TGGTGCCAGA 
CCTCATCAAG CAGTTGATGC AATTTGGATA GCAGCAAGAG TGATTAGTGG CATACAAGAA 
GCCATAAGTA GATGCTTGGA TCCTCTCTCA CCAGTTGTGA TTAGTTTTGG CAAAATACAA 
GGTGGACAAG CTTTTAATGT CATTGCAGAT AAAGTTAGGC TTTTGGGAAC AGTTCGCTGT 
TTAGACCTTC AATTAAATGA AACGTTACCC AATTGGATTG AAGAGACAGT AAAAAAAATT 
GCTTCTAATT TTGGAGCTGA GGCAAAAGTG CAATATCGCT CAATAGCACC ACCTGTTTAT 
AACGATCCTA AGTTGACTCA ATTACTAGAA AATTCTGCAA TTGCATTACT TGGCGATGCA 
AATGTTCTCC GCTTAGAACA GCCTTCTTTA GGAGCAGAAG ATTTTGCTGA GCTTTTGCAA 
GATATTCCTG GGACTATGTT TCGTCTGGGT GTAAGTGGTT TGAATGGATG CGCTCCTCTC 
CATAATGGGT ACTTTGCTCC TGATGAAAGA TGTTTAGAAA TAGGGATTAG TGTATTGACA 
AGTACGCTTT TGGATTGGAT GCAAAAAAGG GGACATCATT GA

Protein sequence

MPFSDCHKES LRLFLPELIT IRRHLHAHPE LSGQEHQTAA TVAGELKKYG WDVTEGVGRT 
GVIAELGDKS APCVGLRVDM DALPVEEKTG LPFSSFNQGV MHACGHDLHT CIGLGVAKLL 
AEDKSKLSGV RLLFQPAEEI ASGAKWMKED GALTGLDALF GVHVFPEIPV GQIGVRRGVL 
TAAAGELQVE ILGNGGHGAR PHQAVDAIWI AARVISGIQE AISRCLDPLS PVVISFGKIQ 
GGQAFNVIAD KVRLLGTVRC LDLQLNETLP NWIEETVKKI ASNFGAEAKV QYRSIAPPVY 
NDPKLTQLLE NSAIALLGDA NVLRLEQPSL GAEDFAELLQ DIPGTMFRLG VSGLNGCAPL 
HNGYFAPDER CLEIGISVLT STLLDWMQKR GHH