Gene Nwi_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nwi_0449
Symbol
ID	3676624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter winogradskyi Nb-255
Kingdom	Bacteria
Replicon accession	NC_007406
Strand	+
Start bp	505255
End bp	506610
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	62%
IMG OID	637711990
Product	peptidase S41A
Protein accession	YP_317068
Protein GI	75674647
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.143572
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.477373
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGCA AGGTTTCCCT TATTGTTCTC AGCGCTGCCG CGGGTGCCGC GTTGACGCTG 
TTCGTGACGC AGCCGCGATC CGTGCTGATG GGATCGAGCG CGCGCGCCGC GACGTCGGAT 
ACCTATCGCC AGCTCAACCT GTTCGGCGAC GTGTTCGAGC GTGTCCGCAC CGATTACGTC 
GAAAAACCCG ATGACAGCAA GCTGGTCGAA TCGGCCATCA GCGGCATGCT CACGGGTCTC 
GATCCGCATT CGAGCTACAT GGATGCAAAG AGCTTCCGCG ACATGCAGGT CCAGACCCGC 
GGTGAATTCG GCGGCCTCGG CATCGAGGTG ACGATGGAGG ATGGCCTGGT CAAGGTGGTC 
TCGCCGATCG ACGACACGCC GGCGTCAAAG GCGGGGATCC TCGCGAACGA CATCATCACC 
AATCTCGACG ACGAGGCGGT GCAGGGCCTG ACCCTCAACC AGGCCGTCGA CAAGATGCGC 
GGCCCGATCG GCACCAAGAT CAAGCTGAAG ATCATCCGTA AGGGACAAGA TAATCCGATC 
GACGTGACGC TGGTGCGCGA CAACATTCGT GTCCGCTCGG TTCGTTCGCG GACGGAGTCC 
GACGACATCG CCTATATCCG CATCACGACC TTCAACGAGC AGACCACCGA GGGACTGAAG 
AAGTCGGTTT CCGACCTCCA GAGCCAGATC GGTGACAAGC TCAAGGGGTA TATCATCGAT 
CTGCGAAACA ACCCCGGCGG GTTGCTCGAG GAAGCCGTGA CCGTTTCAGA TGCCTTCCTC 
GATCGCGGCG AGATCGTGTC GACGCGCGGG CGCAACGCCG AGGAAACCCA GCGGCGCAGC 
GCGCATCCGG GTGACCTCGC CAAAGGCAAG CCGGTGATCA TTCTGGTCAA CGGCGGATCG 
GCATCCGCGT CGGAAATCGT CGCCGGCGCG TTGCAGGACC ACAAGCGGGC GACCCTGATC 
GGCACCCGCT CGTTCGGCAA GGGCTCGGTG CAGACCATCA TTCCCCTCGG CTCCGGCAAT 
GGCGCGCTCC GGCTGACGAC CGCGCGCTAT TATACGCCCT CGGGCCGCTC GATTCAGGCC 
AAGGGCATCG TTCCGGATAT CGAGGTGCTT CAGGATGTGC CCGATGAATT GAGGTCACGG 
ACCGACACCA AGGGCGAGGC TTCGCTGCGG GGACACCTGC GAAACGGCAA CGACGAGAAG 
ACAGGCTCGC AATCCTACGT CCCGCCGGAC GCCAAGAACG ACAAGGCGCT CAAGATGGCC 
GGAGACCTTC TGCGCGGCGT CAAGATCAAC GCCTCTTCGC CGCCCTCCAA CAATAAAGCG 
GCGATCGAAA AGCCCGCGAA CAAGGCGGCG AACTGA

Protein sequence

MMRKVSLIVL SAAAGAALTL FVTQPRSVLM GSSARAATSD TYRQLNLFGD VFERVRTDYV 
EKPDDSKLVE SAISGMLTGL DPHSSYMDAK SFRDMQVQTR GEFGGLGIEV TMEDGLVKVV 
SPIDDTPASK AGILANDIIT NLDDEAVQGL TLNQAVDKMR GPIGTKIKLK IIRKGQDNPI 
DVTLVRDNIR VRSVRSRTES DDIAYIRITT FNEQTTEGLK KSVSDLQSQI GDKLKGYIID 
LRNNPGGLLE EAVTVSDAFL DRGEIVSTRG RNAEETQRRS AHPGDLAKGK PVIILVNGGS 
ASASEIVAGA LQDHKRATLI GTRSFGKGSV QTIIPLGSGN GALRLTTARY YTPSGRSIQA 
KGIVPDIEVL QDVPDELRSR TDTKGEASLR GHLRNGNDEK TGSQSYVPPD AKNDKALKMA 
GDLLRGVKIN ASSPPSNNKA AIEKPANKAA N