Gene Bind_0797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0797
Symbol
ID	6199090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	890259
End bp	891239
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	59%
IMG OID	641704794
Product	PDZ/DHR/GLGF domain-containing protein
Protein accession	YP_001831936
Protein GI	182677790
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCTCA AGGACGAAGA CTGGAAAATT CCACCCGAGG CCCAGCCCAA ACAAGGCAAT 
TTTCGTTTCG ATCTCGAACA GACGATGAGT TCCATCGTCT CGATACGCTC ACGTGTGCCG 
GCCGATGCCT TTACCGCCGG TATTTTGGGG ACGGAACGGT CCGGCAATGG CGTGCTGATC 
GACGCCGATG GTATTGTCCT GACGATCGGC TATCTCGTGA CCGAAGCCGA GGAAGTCTGG 
CTCACCACCA ATGACGGTGT GGTCGTTGCC GGCCATGTGC TCGGCATTGA TCCCGCGACG 
GGTTTCGCCC TTGTGCAAGC GCTCGGCCGG CTGGAATTGC CCGTTATGCC GCTTGGGGAA 
TCGCACAGCA CAAGGGTCGG CGAGAGGGTG ATCATTGGTG GCGCTGGCGG TGTCGCGCAT 
GCGCTCATCG CCCATATTGT CGCCAAACAG GAATTTGCCG GCTATTGGGA ATATGTCCTC 
GACGAGGCTT TGTTCACTGC TCCGGCGCAT CCCGATTGGG GCGGCGCGGC CATGATCAGC 
GTGACCGGCA AGCTGCTCGG CATCGGCTCC CTGCAAGTGC CGCATCAGGT TCATGGCGAA 
CAGGTGCTGC AGCTCAATAT GATGGTGCCG ATCGATTTAT TGGGACCGAT CTACGCGGAT 
CTGCGGATGT ATGGTCGTCC CAATCGGCCA CCGCGTCCTT GGCTCGGCCT GTTTGCCGCC 
GAGGATCATG ACAGGATCGT GGTCATTGGC TTTGCCGGTA ATGGTCCAGC CAAGCGCGCG 
GGACTGAACG AGGGGGATAC GATCCTGGCT GTCGCTGGCC ATCCGGTCTC GACGCTCGTC 
GATTTGTTTC GGCATATCTG GGCCCTGGGG GCCGCCGGAT GCGATGTTCC GCTCACGCTT 
GAACGGGAAG GGGATGTGTT TGAGGTTCAT CTCACATCCG CCGATCGGGA GCGCTATCTG 
AAATCGGCTT CAATGCATTA G

Protein sequence

MVLKDEDWKI PPEAQPKQGN FRFDLEQTMS SIVSIRSRVP ADAFTAGILG TERSGNGVLI 
DADGIVLTIG YLVTEAEEVW LTTNDGVVVA GHVLGIDPAT GFALVQALGR LELPVMPLGE 
SHSTRVGERV IIGGAGGVAH ALIAHIVAKQ EFAGYWEYVL DEALFTAPAH PDWGGAAMIS 
VTGKLLGIGS LQVPHQVHGE QVLQLNMMVP IDLLGPIYAD LRMYGRPNRP PRPWLGLFAA 
EDHDRIVVIG FAGNGPAKRA GLNEGDTILA VAGHPVSTLV DLFRHIWALG AAGCDVPLTL 
EREGDVFEVH LTSADRERYL KSASMH