Gene Bind_2834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_2834
Symbol
ID	6198993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	3229588
End bp	3231429
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	60%
IMG OID	641706781
Product	thiamine pyrophosphate protein central region
Protein accession	YP_001833892
Protein GI	182679746
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3962] Acetolactate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATGG TCCGCTGCAC CATGGCGCAG GCCCTGGTTC GTTATCTTTG CAATCAATTC 
ACCATCGTTA ACGGCCAGCG TGTGCCGCTC TTTCCCGGTG TCTTCGCAAT CTTTGGCCAC 
GGCAATGTCA CTTGCCTCGC GGAAGCGCTG GAAGCTGTTC AGGATAAGCT GCCGACCTGG 
CGCGGCCAGA ATGAGCAATC CATGGCGCTG GCAGCGATCG GTTTTGCCAA GGCGGTCCGG 
CGCCGGCAGA TCATGGTCGC GACCAGTTCC ATTGGCCCCG GCGCTCTCAA CATGGTGACG 
GCCGCCGGTG TCGCCCACAC GAACCGCCTG CCGGTGCTGT TGCTCGCTGG CGACACTTTC 
GTCAATCGCC GGCCAGATCC AGTCATGCAG CAGGTCGAGC ATTTCGGTAA TCCGACCATC 
ACCGTCAATG ATGCTTTCAA GGCGGTCACC CGTTACTGGG ACCGTATCGT CCACCCCGAG 
CAGGTCATCT CATCCTTGCC GCAGGCGGTC GCTGCCATGC TCGATCCGGC CGATTGCGGT 
CCGGCTTTCA TCGCCCTCCC CCAGGACGTG CAGGAAATGG CTTGGGACTA TCCCGAAGCC 
TTTTTCGCGG AAACGGTGCA TAACATTCCA CGGCCGCGCC CGGATCGTGG GCGCCTCGAT 
GAAGCAGCCT CTCTTCTCAA GAATGCACAG CGGCCGCTGA TCATTTCAGG AGGCGGTGTA 
CGTTATTCCG GCGCCGAAGA TGCCCTCGCC GCTTTCGCCG CGAAACACGG CGTTCCGCTG 
TGTGAAACCA TTGCCGGCAA GGGGAGTGTT TCGCATGACC ATCCCGTTCA TGTCGGGCCG 
ATCGGCATTG TCGGCTCGAC ATCGGCCAAT GCCATGGCCG CGGAAGCGGA TGTGATTCTC 
GCTGTCGGCA CGCGGCTCAT GGATTTCACG ACAGGCTCCT GGTCGTCTTT CCGGCAGGAC 
GCCAAATTCA TCACTGTCAA TACGGCGCGC TGGGATGCGA CCAAACATCG GGCGCTTGCT 
GTAGTCGGCG ATGCGCTCGA AACAGTAAAG GAACTCGATC AAAACCTTGA TGGCTGGACG 
GCCGATACCG CCTGGACCGA ACAGGGAAAG ATCGAATTCG CGAAATGGAA TGTGGCGCTC 
GACGGTTTCC AAAAGCCGAC CAACGATCCA ATTCCCACTT ATGCGCAGGT CATCGGCGTG 
GTGAACGCCA AGGCTGGCGA ATATGATCTC CTGATCACGG CGGCGGGCGG CCTACCCGGC 
GAAGTCATGA AGAACTGGCG TGTGAAGGCG CCGAATACAT TCGATTGCGA ATTCGGCTTT 
TCCTGCATGG GCTATGAAAT CCCTGCTGGC TGGGGCGCCG CCATGGCCGA TCCCACACGC 
ACACCCATCG TCATGATCGG CGATGGCACA TACATGATGA TGAATTCGGA TATCTATTCC 
TCGGTTCTGT CAGGGCACAA GATCATTCTC ATCGTCTGCG ACAACGGCGG TTATGCCGTC 
ATCAATCGTC TGCAAAACGC CAAGGGCGGT GCCTCCTTCA ACAATCTCCT CAAGGATTGT 
CGGGTGAAGG AGCCCTTCGC GGTGGACTTC AACAAACATG CAGAAGCGAT GGGTGCTCTG 
ACGCGGCGGG TGGAAAGTCT CGCCGATCTC GGCCAGGCCG TGGAATGGGC GAAGACCACC 
GACCGCACCA CCGTCATTAC CATCGTTTCC GACGCCTTCA CCTGGACCCC GGGCGACGCC 
TGGTGGGATG TGGGCGTGCC GCAAGTGAGT GTCCGCGCGG AAGTCAGTAA TGCCGCGCAA 
CAGCAGCAGG AAGGACGGAC CCGCCAGCGC GTCGGCGTCT GA

Protein sequence

MAMVRCTMAQ ALVRYLCNQF TIVNGQRVPL FPGVFAIFGH GNVTCLAEAL EAVQDKLPTW 
RGQNEQSMAL AAIGFAKAVR RRQIMVATSS IGPGALNMVT AAGVAHTNRL PVLLLAGDTF 
VNRRPDPVMQ QVEHFGNPTI TVNDAFKAVT RYWDRIVHPE QVISSLPQAV AAMLDPADCG 
PAFIALPQDV QEMAWDYPEA FFAETVHNIP RPRPDRGRLD EAASLLKNAQ RPLIISGGGV 
RYSGAEDALA AFAAKHGVPL CETIAGKGSV SHDHPVHVGP IGIVGSTSAN AMAAEADVIL 
AVGTRLMDFT TGSWSSFRQD AKFITVNTAR WDATKHRALA VVGDALETVK ELDQNLDGWT 
ADTAWTEQGK IEFAKWNVAL DGFQKPTNDP IPTYAQVIGV VNAKAGEYDL LITAAGGLPG 
EVMKNWRVKA PNTFDCEFGF SCMGYEIPAG WGAAMADPTR TPIVMIGDGT YMMMNSDIYS 
SVLSGHKIIL IVCDNGGYAV INRLQNAKGG ASFNNLLKDC RVKEPFAVDF NKHAEAMGAL 
TRRVESLADL GQAVEWAKTT DRTTVITIVS DAFTWTPGDA WWDVGVPQVS VRAEVSNAAQ 
QQQEGRTRQR VGV