Gene Bpro_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bpro_4033
Symbol
ID	4013283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas sp. JS666
Kingdom	Bacteria
Replicon accession	NC_007948
Strand	+
Start bp	4234645
End bp	4235754
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	66%
IMG OID	637943682
Product	putative zinc protease protein
Protein accession	YP_550825
Protein GI	91789873
COG category	[R] General function prediction only
COG ID	[COG4324] Predicted aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.213397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAACCC GGGTGGCCCA AGTGGCCCTC ACCTGGCCCG CCATCCGGGC CACCGCCATG 
GCGGCCATCG CCGCCCTGGG CCTGTCGGGC TGCACCGGTA TCGGCTACTA CTGGCAGTCG 
GTCAGCGGCC ACCTGCAGAT GATGAACGCG GCACGCCCGG TCAGCGACTG GCTGGACGAT 
GCGCAAACCC CCGAGCAGCT CAAAACCCGG CTGGCCCTGA GCCAGCGCAT CCGCAGCTTT 
GCCGCGAGCG AGCTAAAACT GCCCGACAAC GCCAGCTACC GCCGCTATGC CGACCTGCAG 
CGCCGGGCCG TGGTGTGGAA CGTGGTGGCG GCCCCCGAGT TGTCGCTCAC CCTCAAGACC 
TGGTGCTTTC CAGTGGCGGG CTGCGTGGGC TACCGCGGTT ATTTTGACGA AGCCGAGGCG 
CGCGCTGAAG CAGCGCGGCT GCAAACCGCG GGGCTGGAGG CCGGCGTCTT CGGCGTGCCG 
GCCTACTCCA CGCTGGGCTG GCTGAACTGG GCCGGCGGCG ATCCGCTGCT CAACACCTTC 
ATCGCCTACC CCGAAGGCGA GCTGGCCCGG CTGATCATTC ATGAACTGGC GCACCAGGTG 
GTCTACGCCC AGGATGACAC CATGTTCAAC GAATCATTTG CGACGGCGGT GGAACGGCTG 
GGCAGCCAGC GCTGGCTCGC CACCCAGGCC AGCCCGGCGG CCCGGGCCGA GTACGCGGCC 
TTTGACAGTC GGCGCCAGCA GTTCCGGGCG CTGGTGCGGG CCACGCGGCA CAGGCTGGAT 
GCAATTTACG ATTTGAATTG GGCGCCAGCG CCCGCCAGAG CCGCGCAAGT TGCGATGAAA 
AGCATCGCTA TTTCAGATTT CAAGCAACAG TATGAGCAAC TCAAAACCAG CTGGGGCGGC 
TTCGCCGGCT ACGACCCCTG GGTCGCCCAG GCCAACAACG CCGCGTTTGG CGCGCAGGCC 
GCCTATGACG AACTGGTGCC CGGCTTTGAG GCGCTGTTCA AGCGCGAAGG CGGCGACTGG 
CGGCGGTTTT ATGATGCGGT GAAGCGACTG GCCAGCCTGT CCAAAGAAGA ACGGCACCAG 
GCTCTTGCGA CCCATAACAC CGATAAATAA

Protein sequence

MKTRVAQVAL TWPAIRATAM AAIAALGLSG CTGIGYYWQS VSGHLQMMNA ARPVSDWLDD 
AQTPEQLKTR LALSQRIRSF AASELKLPDN ASYRRYADLQ RRAVVWNVVA APELSLTLKT 
WCFPVAGCVG YRGYFDEAEA RAEAARLQTA GLEAGVFGVP AYSTLGWLNW AGGDPLLNTF 
IAYPEGELAR LIIHELAHQV VYAQDDTMFN ESFATAVERL GSQRWLATQA SPAARAEYAA 
FDSRRQQFRA LVRATRHRLD AIYDLNWAPA PARAAQVAMK SIAISDFKQQ YEQLKTSWGG 
FAGYDPWVAQ ANNAAFGAQA AYDELVPGFE ALFKREGGDW RRFYDAVKRL ASLSKEERHQ 
ALATHNTDK