Gene Bind_1920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1920
Symbol
ID	6198819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	2189080
End bp	2190150
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	57%
IMG OID	641705909
Product	choloylglycine hydrolase
Protein accession	YP_001833033
Protein GI	182678887
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA CCAAACACTC ATTCGCCCGC TCCCTGCTCG CGCTCAGCCT CATGTCATTG 
GTGATGACAA CCCCCCTGGC AGAAGCCTGT ACACGGGCGG TGTTTCTCGG GCAAGATGGC 
CAAGTCGTCA CGGCGCGTTC CATGGATTGG AAGACGGATA TCGGCACCAA TCTGTGGATC 
TTTCCGCGCG GCATGGAGCG CAATGGCGAG ACGGGGCCGA AGACTGTTCG CTGGACGTCG 
AAATATGGCA GCGTCATCGC CTCCGCCTAT GATGTCTCGA CCTCGGATGG TCTCAATGAG 
GCAGGTCTTT CGGCCAATCT GCTTTGGCTG GTCGAGTCCC AATACCCCGC CTTCGACCCG 
TCCAAGCCGG GGCTCACTAT CGCCGCCTGG GCGCAATATG TGCTCGACAA TTTCGCCACT 
GTGGCCGAGG CCGTGGATGC ACTTTCACGC GAGCCTTTCG TGCCGGTGAC GGCGGATATT 
CCAGGAGAGA CGCGCCTTGC GACCGTTCAC CTTTCCATTT CCGATGCGAC GGGTGACAGC 
GCCATCATCG AATATGTCAA CGGCAAGCAG GTCATTCATC ACGATCGCAA ATATCAGGTG 
ATGACCAATT CGCCTTTGTT CGATCAGCAA TTGGCATTGG ACTCTTATTG GCAGCAGATT 
GGCGGCACAA TCATGCTGCC GGGCACGAAC AGGGCGTCCG ACCGTTTCGC ACGCGCGTCC 
TTTTACATCA ATGCCATTCC GAAGGATGAG ACGCCCAATC GCACTATTGC CAGCGTCTTC 
AGTGTCATTC GCAACGCATC CGTGCCCTAT GGACTGAACA CGGCCGAGGA GCCCAATATT 
TCCTCGACAC GATGGCGCAC CGTCGCGGAC CACAAGCGCA AGCTTTATTT CTTTGAATCG 
GCGCTGACGC CCAATGTCTT CTGGGTCGAT CTCAAAACCA TCGACTTCTC GCCGGAAACC 
GGAAAAGTGC GCAAGCTCGA CCTCGGCCCG GAGCAGACCA ACATCTTTTC CGGCAATGCA 
ACGGAGAATT TCAAGGAAGC CAAGCCATTC AGATTTTTAG GCTTGCCTTG A

Protein sequence

MSNTKHSFAR SLLALSLMSL VMTTPLAEAC TRAVFLGQDG QVVTARSMDW KTDIGTNLWI 
FPRGMERNGE TGPKTVRWTS KYGSVIASAY DVSTSDGLNE AGLSANLLWL VESQYPAFDP 
SKPGLTIAAW AQYVLDNFAT VAEAVDALSR EPFVPVTADI PGETRLATVH LSISDATGDS 
AIIEYVNGKQ VIHHDRKYQV MTNSPLFDQQ LALDSYWQQI GGTIMLPGTN RASDRFARAS 
FYINAIPKDE TPNRTIASVF SVIRNASVPY GLNTAEEPNI SSTRWRTVAD HKRKLYFFES 
ALTPNVFWVD LKTIDFSPET GKVRKLDLGP EQTNIFSGNA TENFKEAKPF RFLGLP