Gene Bind_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1930
Symbol
ID	6200939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	2200981
End bp	2202525
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	61%
IMG OID	641705919
Product	peptidase S10 serine carboxypeptidase
Protein accession	YP_001833043
Protein GI	182678897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCCTG TTCGAGGTTT TATTCTTCTC GCGACAATTT CGCTTCTCTT CACCCTCCCC 
TTGACCTTTC CTTCCTCGGC TAGGGCTGAA CAAACGGTCC CAATCCCGCG CGCGGAAACC 
GAACAGACCA AGGATACCAC GCCGCCGCAT CCCCTGCCCG CTCCGGTTAC GACGACCCAT 
ACGCTCGATC TGCCCGGACG CAGCCTGAAT TTTCAGGCCA TAGCCGGAGC GATCAAACTT 
TCCGACGCGC AAAGCGGCAC ACCAGAAGCC GACATTGGTT TTACCGCCTT CCTCCTCAAC 
GGCCAGGAAG CGTCACAGCG CCCCATCGTG CTGGTCTTTA ACGGCGGGCC GGGAGCTTCT 
TCCGGCTGGC TTAATCTCGG CGCGCTCGGA CCGTGGCGGC TCAAAGCCGA CGCTCCTCTT 
CTTGCGCCCT CACAACCGCC CATGCTCGTG CCCAATGCCG AGACCTGGCT CGATTTCGCC 
GATCTCGTCT TTTTCGATCC GCCCGGCACC GGCTACAGCC GGCTTTACGG CAAGGATGAC 
GAAGCCCGGC GGAGCTTTTT TTCCGTCAAT GGCGACATCA GCGCCTTGAG CGTCGCCATT 
CGCAAATGGC TGGCCGAGCA TGATCGTCTC GCCAGTCCGA AATTCATCGT CGGTGAGAGT 
TATGGTGGAT TTCGCGCGCC CAAACTCGCC CGTCGCCTGC AAGAAACAGA AGGCATCGGC 
GTTTCGGGCC TCATCATGAT CTCGCCTGTC CTCGATTTCA GTTGGTTCGA GGGCGCCAAT 
AATCCCCTCA TCGCGGTCGC GCGACTGCCA TCGCTCACCG CCACCGCGCG CGGACTCGAT 
GGAGGCGCGA GCCGAGCCGA TCTCGCCGAT GTGGAAGCCT ATGCAAGCGG CCCCTATCTC 
GTCGATCTCC TGCGCGGCGA ACGCGATCCC GCCGCGCTCG ACCGGCTGGC GGCCAAGGTT 
TCCGCATTCA CCAAGCTCGA TCCCACTCTG GTGCGTCGGC TCGGCGGCCG TATCGATCTT 
GCGACGCTCT CACGTGAGCG CAAGCGCGAT GAAGGCAAAG TCGCAAGCCT CTATGACGCA 
CGCATTCTCG GCTATGATCC TGATCCCCAT CAGGCCTCGA GCGATTATGC CGATCCAATC 
CTGGACGCTT TGCGCGCACC TCTCGCCAGC GCCATGGCGG ATCTCATCGC GCATCGCTTG 
AACTGGCCGA TCGAGGCTCG CTATGAAATT CTCAACGACA ATGTCAATCG GCAATGGAAT 
TGGAACCCGG ATCGGGGCCA TGCCCATGCC CAGGCGGAAT CCTTAAGCGA CCTCAAACAT 
GTGATGGCGC TCGATCCGCG CCTGCGCGTG CTGGTCATCC ATGGATTGAG CGATATTGTA 
ACGCCCTATT TCGCCTCGAA ACTTCTGCTC GACCAAGTCG CACCCATGGG CGATCCTGAT 
CGCCTGCGTT TGTCGGTCTA TCCAGGCGGC CACATGCTCT ATCTCGAAGA GACGAGCCGA 
GCGAAATTGC GCGAGGATGC GGCCAAGCTG ATCACCGGTC CCTGA

Protein sequence

MRPVRGFILL ATISLLFTLP LTFPSSARAE QTVPIPRAET EQTKDTTPPH PLPAPVTTTH 
TLDLPGRSLN FQAIAGAIKL SDAQSGTPEA DIGFTAFLLN GQEASQRPIV LVFNGGPGAS 
SGWLNLGALG PWRLKADAPL LAPSQPPMLV PNAETWLDFA DLVFFDPPGT GYSRLYGKDD 
EARRSFFSVN GDISALSVAI RKWLAEHDRL ASPKFIVGES YGGFRAPKLA RRLQETEGIG 
VSGLIMISPV LDFSWFEGAN NPLIAVARLP SLTATARGLD GGASRADLAD VEAYASGPYL 
VDLLRGERDP AALDRLAAKV SAFTKLDPTL VRRLGGRIDL ATLSRERKRD EGKVASLYDA 
RILGYDPDPH QASSDYADPI LDALRAPLAS AMADLIAHRL NWPIEARYEI LNDNVNRQWN 
WNPDRGHAHA QAESLSDLKH VMALDPRLRV LVIHGLSDIV TPYFASKLLL DQVAPMGDPD 
RLRLSVYPGG HMLYLEETSR AKLREDAAKL ITGP