Gene Bind_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1095
Symbol
ID	6199922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1255217
End bp	1258228
Gene Length	3012 bp
Protein Length	1003 aa
Translation table	11
GC content	60%
IMG OID	641705087
Product	Sel1 domain-containing protein
Protein accession	YP_001832226
Protein GI	182678080
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAACAGG ATTCGGGACA GGATTTACCG CGTAGTGCCA AGGCCCAGAC AGCTCCACTT 
GGGAAGGGGG CGGCGGTCTC GCGCAGGCCT GCATTTTTGG CAGGAACCGA AACCTTGGAA 
GAACGGGCTC AGAGGGCTTG GGCTTTCGCG CATAATAGAG GAATGATCCG GGCGCTCGAG 
AATCGCCGTG ACCGGGAATG GGAAATGGTC GCCAGTCTTT CCTGCTCCGG AGAGGATGGA 
TTTCTTCCGT TCGATGAATG GCAGGCGGTA CGCTCGGATG GCCATGGGTT GCAAAGTGAC 
GAGTTGCGTC GGGAGACGAC TTTGGGAGCG GATTTCAAGA CCGGTCGCGG ATTGCCAGAG 
GGTCAGGCTT CTCTCGAAGG CCTGTGGAGC GAACTTGAAT CGGAATTACT GGCCTTCGCC 
CGCCGTCGTG GCCATGCTTT CGCTTCCAGC GGCCGGGTCG GCGTGGATCA TCGGCAGAAC 
GCGGCAAAAG GACCGGGCGC GAGTAGCACC GCCTCAGCAG CCCAGAGCGC TTCTTTGTCG 
GACTTACGGG ATGATGTCGG TCAACTCGCT GGTCAACTCG ATGCCATGCG GCAGGAAGCG 
GATCGTCGCG ACAGCCTGTT GCGGAGCCAG GCGGAACGCA TTGGCGACAT CGGGCGGTTT 
CGCAAGGAAA TCAGCGATCT GACGAGCCGG CTCGGTGCTT TCGCGCCGCT GGAGGCCTTG 
CGTGAACTTG ACCGGGAAAT CAAGGCTATT GCCCAACGGT TTGAAAAATT AGGGGAAACC 
GAGAGCGACG CCACCCCGAT ACTGCGCTTG CGGCAGCAAT TGCATGAAAT TCGCGAACTC 
ATCACGGCCA TGGCGAGCCT TGCGGAAAAT ACGGTTCGGC AAAAGCCGGC CGCTGATCTG 
GAAGTCTTGC GAGGGACGTT GAACGATCCG GTCCGTGCGG AATCGCTGCA GAAGATCGAG 
ACCCAGATCG AGGTTTTGGG GCAAAGGGTC GATACAGCCA TCGCGCAGGC GGAAACATCC 
GGGCAATATG CCGCCCTGGC GCGGCAGATC GAGGCCGTCA AACACCAATT GACGGCGCGC 
ATCGACGCCA ATGCCACGCT CAGCGCGCCG CATACGCAAC AACTCGAACA ATTGGTGCGT 
GTGCTGGCCG ACAAAATGGA TTCCTTGCCC GATCCGCGCA AGAGCGAACA GAAGTTCGAG 
GTTCTTCAAT CCGAACTCGT CCGGATCGAC AATCGCCTCG ACCAAAGTGA CAAGATCATC 
GCCTCTCTGG CGGCCATGGA AATGACCATT ACGCGGCTTT CCGCCGAGAT GGGCGTGATC 
AAGGGCTCGT TGCGGCAATC TGCCGAAGCG GCCGCGCGTC AGGTCATTGA AGAGCTTCGG 
CAGACATCCT CCACGGAACC TCTGATTCCG GCTGATTTGG AAAACGAGAT CGAAAAACGG 
TTCGAGCGCA CCGAGGTCAT GATCCGCGAT GGCCTGGAGA GACTTGCCAG CCGGCTGACC 
GATCTTGAAA CCGTTACACA TCTGGCTCGA GGCCCTGTGA CACAGGCCGG GTCCCTGGGA 
TCATTGCTGG CGCCGATCTT TGCACCCGCC AGCGAGGGGC AAGGGGAAAC AGCCAGTGTT 
TTTAATATTT CCCTCGACAA GGCTCCGGGA TCGGTGCGGG AAGACCTTGA CCCCTGGCGT 
TCTGAGCGGG TCTCCTCGGT ACGCGGTTCT GTCTCGGCAG GCCAGAAAGT TTTGCCTCGT 
GCGGAGACAG GGCCGGTTCC CCTTCAAGGT GAACGCCGGG CCAGGCAAGA GAACAAGGGC 
CCCACGCTGG TCGAGGATGA ATTGCTCGAA CCGGGCAGCG GCCGTCCCCT CTTGTTGCGC 
TCCAGCGGAA TGAAGAAAGG GACTTTCAAG GATCGTGAAT CCGAGGCGAT CGCGGGGCCC 
AAGGCCAGAA TGAAGCAAGG GGAATCCGTG CCGAAGGGTG CGGACAAACT GGTCCTTCCG 
CCTTCGCGAG AGCAATCCAC CTCTTTTGAT CGGATGATCC GTCTGCTCAA AAGCGCCCGC 
CATTTGGTCC GGGGACGGCT AGTCTTGTTT TCGCTCGCGG GACTTTTCTC CCTGGCCGTC 
CTGGATGGAT TGGTGCATGC CATCGGGAGC ATGGATCAGC GGAACAATGC GGGCCATGCG 
GAACAATCCG GTCCGGCCAA GACCGCGAAT TTTGTGGAAA CCTCGCCGCA GTCCTCAGCG 
CCAGCCGCCA CAATTCCGGC CACGACCCAG AAAACATCCG AAACCCCTGC CGCAGCCAAA 
TCCAGCATAA ATAAAGTGGG GGCGCTGGCC TTTTCGACAC GGGAAGACAT TCTGCGCCTC 
TTCCGCTTGG GTGAAGCCGG CCATGCCGGC GCGCAATATC ATCTTGCCTT GCTCTTGCAG 
GAAGGCACGG CCCATGCGGA AGGAAATGAC CAGGCGACGG ATCTGCGCGC CGCCGCTTTT 
TGGTACGGGA AAGCCGCTGA CCAGGGTCTC GCCCCGGCGC AATATCGGCT AGGCCTGCTC 
TACGAAAAAG GCTTCGGCGT AGACCGCGAT CTTCACAAGG CGACGGATCT TTATCGCCAG 
GCGGCGGAGC AGGGCAATAC ACGCGCCATG CATAATCTTG CTGTCCTCTC GGCCGAATCC 
GAAAATGGTC CGCCTGATTA TGCGGCCTCT GTCAAATGGT TCACCAAGGC CGCCGAATAT 
GGCCTGCGCG ACAGCCAGTA TAATTGTGCG ATATTGCTCG CCCGGGGGCT CGGCGCGCCG 
CGCAATCTGG TTCAGGCCTA TGCCTGGTTC GCCATTGCGG CGGCTCAGGG AGACGAGGAA 
GCCGGTCGCA AGCGCGATGA AGTGGCGCGG CATCTTTCAA CGGAAGATTA CACAGCGGGC 
AAAACCATAG TCGCCGCATA CAGGCCCCAG CCGTCCAAAA TGGCGGCTAA TGAAGTGTCT 
ATGCCTTCAG GCGATGGGGA GCAGGGATCG CGCCAGGCCG AGGTGATGAA GCCGAGCCTT 
TCTGGTCTGT GA

Protein sequence

MEQDSGQDLP RSAKAQTAPL GKGAAVSRRP AFLAGTETLE ERAQRAWAFA HNRGMIRALE 
NRRDREWEMV ASLSCSGEDG FLPFDEWQAV RSDGHGLQSD ELRRETTLGA DFKTGRGLPE 
GQASLEGLWS ELESELLAFA RRRGHAFASS GRVGVDHRQN AAKGPGASST ASAAQSASLS 
DLRDDVGQLA GQLDAMRQEA DRRDSLLRSQ AERIGDIGRF RKEISDLTSR LGAFAPLEAL 
RELDREIKAI AQRFEKLGET ESDATPILRL RQQLHEIREL ITAMASLAEN TVRQKPAADL 
EVLRGTLNDP VRAESLQKIE TQIEVLGQRV DTAIAQAETS GQYAALARQI EAVKHQLTAR 
IDANATLSAP HTQQLEQLVR VLADKMDSLP DPRKSEQKFE VLQSELVRID NRLDQSDKII 
ASLAAMEMTI TRLSAEMGVI KGSLRQSAEA AARQVIEELR QTSSTEPLIP ADLENEIEKR 
FERTEVMIRD GLERLASRLT DLETVTHLAR GPVTQAGSLG SLLAPIFAPA SEGQGETASV 
FNISLDKAPG SVREDLDPWR SERVSSVRGS VSAGQKVLPR AETGPVPLQG ERRARQENKG 
PTLVEDELLE PGSGRPLLLR SSGMKKGTFK DRESEAIAGP KARMKQGESV PKGADKLVLP 
PSREQSTSFD RMIRLLKSAR HLVRGRLVLF SLAGLFSLAV LDGLVHAIGS MDQRNNAGHA 
EQSGPAKTAN FVETSPQSSA PAATIPATTQ KTSETPAAAK SSINKVGALA FSTREDILRL 
FRLGEAGHAG AQYHLALLLQ EGTAHAEGND QATDLRAAAF WYGKAADQGL APAQYRLGLL 
YEKGFGVDRD LHKATDLYRQ AAEQGNTRAM HNLAVLSAES ENGPPDYAAS VKWFTKAAEY 
GLRDSQYNCA ILLARGLGAP RNLVQAYAWF AIAAAQGDEE AGRKRDEVAR HLSTEDYTAG 
KTIVAAYRPQ PSKMAANEVS MPSGDGEQGS RQAEVMKPSL SGL