Gene Bind_1009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1009
Symbol
ID	6200437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1157789
End bp	1159195
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	60%
IMG OID	641705000
Product	peptidase M16 domain-containing protein
Protein accession	YP_001832141
Protein GI	182677995
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TGGTCTGCAT GTCTCAGGGT CAGTCGAGCG CGGCATCACC TGTTCAAGGT 
TCTTTCGGCC TCACCCCTTC GCCAGCCAAT CCGGCCAAGG CCCATGGGCC GCAAGTCAGT 
CAGGCGAAGC TCGCCAATGG CATGGACATT GTGGTCATTC CTGACCATCG CGCGCCTGTC 
ATCACCCATA TGGTCTGGTA TCGTAACGGG TCCGCCGATG ATCCAGTGGG CAAGTCCGGC 
ATTGCGCATT TCCTTGAACA TCTCATGTTC AAGGGCACCA AGGATCACAA ACAGGGCGAA 
TTTTCCGAAG TGATCGCCGA TTTCGGCGGT CAGGAAAACG CCTTCACCTC GAATGATTAT 
ACCGCCTATT TCCAGCGGGT CGCCAAGGAC CATCTCCGCG TCTGCATGAA TTACGAGGCT 
GACCGGATGA AAAATCTGGT CCTCTCCGAT GAAGTGGTCG CCCCCGAGCG CGATGTCGTG 
CTCGAGGAGC GCCGCATGCG CACGGATTCC GATCCCTCGG ACCTTCTGAA CGAGGCAGTC 
CAGGCCGCCC TTTATACGCA TCATCCCTAT GGCAAGCCGA TCATCGGTTG GAGCCATGAG 
ATCGAAACCC TCGATCGCCA GGATGCGTTT GCCTATTACG ATCGTTTCTA TACGCCAGAA 
AATGCGATTC TCGTCGTCGC CGGCGATGTC GAGCCCGATG AGGTTCTGGC GCTTGCCGAG 
GATGTCTATG GCAAGATCCC GGCCCATGGC GAGGCGCCGC GTCGCTCGCG TCCCCGTGAG 
CCCGAGCCGC GCGCTCATCG GCTCGTCAAG CTCGTCGATG AAAAGGTCGA ACAGCCGACG 
CATCAGGGGG TCTTCCTCGT CCCGTCCTAC AAGACGGCCG CGCCTGGCGA AGCGGAAGCG 
CTTGAAGTTC TCGGCCATTT GCTGGGCGGC GGTCAGACCA GCCTGTTGTT CAAAAAGCTC 
GTCGTGGCCG ATAAAGTCGC CGTTGCCGCC GGCGCCCATT ACCAGGGGAC GGCTGTCGAT 
CAGACGCGCT TCTATGTTTA TGGCATCCCG GCGCCAGGCA TTACGCTCGA GGAAATCGAC 
AATGCCATTG ACGCCGTCAT TGCCCATGTG GCCAAGGAAG GCGTCTCGGA AGCGGATCTG 
CGTCGCACCA AGACCCGACT CGTCGCAGAG GCGATCTATG CCCAGGATAA TCAATCGACA 
TTGGCGCGGT GGTATGGCGC TTCGCTCAGC GTTGGCCTGA CCCTGAACGA TATTGCCGAA 
TGGCCGGCGC GAATCGAGGC CGTTACCCTG GAGGATGTCA AGAAAGCCAC GCGCTGGCTC 
GCCAAAAGGC GCGGCGTTAC GGGTTTCCTC CTGCCGGCCC ATGCCCCAGG AGAACATACG 
ATCGAGGTCG AGACCGAGGC CAGTTGA

Protein sequence

MKAMVCMSQG QSSAASPVQG SFGLTPSPAN PAKAHGPQVS QAKLANGMDI VVIPDHRAPV 
ITHMVWYRNG SADDPVGKSG IAHFLEHLMF KGTKDHKQGE FSEVIADFGG QENAFTSNDY 
TAYFQRVAKD HLRVCMNYEA DRMKNLVLSD EVVAPERDVV LEERRMRTDS DPSDLLNEAV 
QAALYTHHPY GKPIIGWSHE IETLDRQDAF AYYDRFYTPE NAILVVAGDV EPDEVLALAE 
DVYGKIPAHG EAPRRSRPRE PEPRAHRLVK LVDEKVEQPT HQGVFLVPSY KTAAPGEAEA 
LEVLGHLLGG GQTSLLFKKL VVADKVAVAA GAHYQGTAVD QTRFYVYGIP APGITLEEID 
NAIDAVIAHV AKEGVSEADL RRTKTRLVAE AIYAQDNQST LARWYGASLS VGLTLNDIAE 
WPARIEAVTL EDVKKATRWL AKRRGVTGFL LPAHAPGEHT IEVETEAS