Gene Bind_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2041
Symbol
ID	6198883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	2332174
End bp	2333616
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	60%
IMG OID	641706028
Product	protease Do
Protein accession	YP_001833152
Protein GI	182679006
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCTT GCGGCCGTTC CCCTTTTTCT CCCCTTCGCC TCCTCGTTGC CCTCGGTCTG 
GCCACCGGTC TGCTCTGTGA CTTTGGTCCT TCCGCCTCGG CCGAGACGCG AGAAATCCCG 
GTTTCTCATG ATGACGTTCT GCTCTCCTTC GCCGGACCGG TGAAAAAGGC GCAGCCTGCC 
GTTGTCAACG TCTATGCCTC GCGAACAGAG CGGCAGCCGC GCAACGTTCT CCTCGACGAT 
CCGGTTTTCC GGCGTTTCTT TGGCGACGGC AATGGCCGCC GGCCTGGCGG TCCCACGGCG 
CAATCCCTCG GATCCGGCGT GCTCGTTGAT CCGTCAGGCC TTGTCGTCAC CAATTTTCAC 
GTCATCGAAG GCATGACCGA CGTCAAGGTT GCCTTGACCG ACAAGCGGGA ATTCGAGGCA 
ACGATCGTTT TACGGGATCA GCGCACTGAT CTGGCCGTCT TGCGTCTGAA GGGGGGCGAT 
GGGGCCTTCC CATCCATGGA AGTGGGTGAT TCGGACACGC TCCAGGTCGG CGATCTCGTG 
CTCGCCATCG GCAATCCCTT CGGCGTCGGC CAGACCGTTA CCCAAGGCAT TGTGTCGGCG 
CTTGCGCGGA CACAGGTGGG CATTTCCGAT TATGGTTTCT TCATTCAGAC GGATGCGGCG 
ATCAATCCCG GTAATTCCGG CGGCGCCTTG ATCGACATGA AGGCCCGCCT CGTCGGCATC 
AATTCCGCCA TCTTCTCCCA GACCGGCAGT TCGATTGGGA TCGGTTTCGC CATTCCGGTC 
AATATGGTGA AAGTGGTCGT CGCCGCCGCC AAAAGTGGCG GCCATCAGGT GCATCGGCCC 
TGGCTCGGCG CAAGCCTCCA GGGTGTTTCC CGCGAAATCG CTGATTCCCT TGGCCTTGAT 
CGCCCTTCGG GTGCCCTCAT CGTCGAGGTG GCGAGCCAGA GCCCTGCTGC GGAAGCGGGC 
CTCAAACGGG GTGATCTCAT CACACGCATC GACGGGCAGA CGCTGGAGGA CCCGGAATCT 
TTCGGCTATC GTCTCGCGAC GCGCCCACTT GGCGGCAAGG CCCAATTGAC GGTCTTACGC 
AACGGCAAGC CGATCGACGC GACATTGAAT CTTTCCGCCG CTCCGGAACA ACCCCCGCGC 
GATCCGGTCA AACTCAACGG CCATTCGCCC CTCACCGGCT TGAGTGTCGT CAATCTTTCT 
CCCGCCGTCA CTGAGGAATT CTCAATTCAG GGCGCATTCG AAGGCGTGGT GATCAATGAC 
ATTGACGAAA ACTCTCCCGC GGCCAATGTC AATTTTCAAC GTGGCGATGT GATCATCGCC 
GTCAACGGTG CCAAGATCAC CTCGACTCAT CAGCTTGAAA AAGCGATGAG CGAACAGCAT 
TATTATTGGA AGGTAACGGT CGGTCGTGGC CATGATATTT TGACGACGGT GCTCGGCGGC 
TGA

Protein sequence

MTSCGRSPFS PLRLLVALGL ATGLLCDFGP SASAETREIP VSHDDVLLSF AGPVKKAQPA 
VVNVYASRTE RQPRNVLLDD PVFRRFFGDG NGRRPGGPTA QSLGSGVLVD PSGLVVTNFH 
VIEGMTDVKV ALTDKREFEA TIVLRDQRTD LAVLRLKGGD GAFPSMEVGD SDTLQVGDLV 
LAIGNPFGVG QTVTQGIVSA LARTQVGISD YGFFIQTDAA INPGNSGGAL IDMKARLVGI 
NSAIFSQTGS SIGIGFAIPV NMVKVVVAAA KSGGHQVHRP WLGASLQGVS REIADSLGLD 
RPSGALIVEV ASQSPAAEAG LKRGDLITRI DGQTLEDPES FGYRLATRPL GGKAQLTVLR 
NGKPIDATLN LSAAPEQPPR DPVKLNGHSP LTGLSVVNLS PAVTEEFSIQ GAFEGVVIND 
IDENSPAANV NFQRGDVIIA VNGAKITSTH QLEKAMSEQH YYWKVTVGRG HDILTTVLGG