Gene Bind_3069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3069
Symbol
ID	6198152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	3503392
End bp	3504612
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	50%
IMG OID	641707016
Product	SMP-30/gluconolaconase/LRE domain-containing protein
Protein accession	YP_001834119
Protein GI	182679973
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3386] Gluconolactonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.976711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAATG CTGATGCAAA ATCTCGCGCG CTTTTTATTT CGCGGCGTAT TCTGATGCGT 
TCAACTTTTG GCTTGGCGGG TGCGATGGCC TTTCCAGGCC TTGGCAAGAC ACAGAATGAC 
GCCAAGTTCG GAACACCTCC AAGCGTGATT ACTCAACCCC CACGGCAATG GGGACCAACC 
GCACCTCCTT CTCCCTATCC CGACCCTGAT ATCCTTGTTC TCGATCCATC TTTCAACGAC 
CTGCTCTTGG GAATTACAGC AATCCGCCGC GTCTGGACGG GTGGTCGTTG GTTGGAAGGA 
CCAGCGTGGT CAAGCCAAGG TCATTATCTC GTCTTCAGTG ATGTACAAGC TGATATACAA 
TATCGTTATA TTTGGGAGAC TAATCAGGTC ATTCCGTATC GGCAGCCTTC GCATAATAGC 
AACGGTAATA CTTTTGATTT TCAAGGACGG CAAATATCCA CTCAGGATTT TTTTCGACGG 
TTGGTGCGAT GGGAACATGA TGGCAGCATG ACTGTGCTAT CCTCTCAATT TGAAGGCAAA 
TCTTTGAATT CTCCAAATGA TATTGTCCCT CATCCTGATG GCAGCCTGTG GTTTACGGAT 
CCCGCCTATG GCATGACGCT TTCCGAAGGT CACCCAGACA TGGCCAGAGG CCCCGCTAAT 
CCGCAGGGAT TTTTCAATCC GCGCCTCGGG GCTGAGAATA GCGATCTGAT CGGAGGACAA 
AAGCGGGAAT TGCCGAGCAA TGTCTATCGA CTCTCACCAG ATGGCCATCT CGATGCGGTT 
ATTCAGGAGA GCCAAGTGCC AGATCCCAAT GGCCTTTGCT TCTCGCCGGA TTACAAGACA 
CTTTATGTCG TAAGCACTGC AAAAGCACCA AGCGATAATG GCCCCGGTGG CAAAGGCGTT 
ATATATGCAT TTGATGTGCA AGGTGACCGG CCACGTAATA TGCGTTTGTT CACGGACATG 
GTCGTTGATG GGGTACATTG CGGACCGGAC GGATTACGGG CAGATATTTT TGGTAATCTT 
TGGTGTTCAT CAAACGGACC GCTCGGTTAT TCAGGCGTTT TAGTCTTCAA TCCATCTGGT 
AAGTTGATAG GTCGCCTACG CCTTCCGGAG GTTTGTGCCA ATGTAGCCTT TGGAGGGCCA 
AAGAGAAATC ATCTCTTCAT GACTGCAAGC CAATCGCTTT ATATATTGCA AGTCCAGACT 
CAAGGTGCTG CCCCCGGCTA G

Protein sequence

MYNADAKSRA LFISRRILMR STFGLAGAMA FPGLGKTQND AKFGTPPSVI TQPPRQWGPT 
APPSPYPDPD ILVLDPSFND LLLGITAIRR VWTGGRWLEG PAWSSQGHYL VFSDVQADIQ 
YRYIWETNQV IPYRQPSHNS NGNTFDFQGR QISTQDFFRR LVRWEHDGSM TVLSSQFEGK 
SLNSPNDIVP HPDGSLWFTD PAYGMTLSEG HPDMARGPAN PQGFFNPRLG AENSDLIGGQ 
KRELPSNVYR LSPDGHLDAV IQESQVPDPN GLCFSPDYKT LYVVSTAKAP SDNGPGGKGV 
IYAFDVQGDR PRNMRLFTDM VVDGVHCGPD GLRADIFGNL WCSSNGPLGY SGVLVFNPSG 
KLIGRLRLPE VCANVAFGGP KRNHLFMTAS QSLYILQVQT QGAAPG