Gene Bind_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0354
Symbol
ID	6198752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	401158
End bp	402939
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	59%
IMG OID	641704346
Product	shikimate kinase., 3-dehydroquinate synthase
Protein accession	YP_001831497
Protein GI	182677351
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase [COG0703] Shikimate kinase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATG GCGTAAATTC GATTTCTCCC CCACAGCAAG AATACGCGCC GGACGACCGG 
CGCGCTCATT CGATCATCTC CAGTCTTGGT TCACGTTCCC TCGTTCTCGT TGGATTGATG 
GGGTCTGGCA AGACCTCGAC CGGACGCCGC TTGGCGCAAA GGCTCGGCCT TCCCTTCGTC 
GATGCCGATG TGGAAATCGA ATCCGCTGCT GGCATGACGA TTTCCGAAAT CTTCGCGCGC 
CACGGAGAAG ATTATTTCCG GGACGGCGAA CGGCGGGTCA TGGCGCGGCT TCTGGCCGAT 
GGGCCCAAAA TTCTGGCCAC CGGCGGCGGC GCTTTCATGA ACGAGGAAAC CCGTTCCCGC 
ATCGCCGAGA AAGGCGTATC GATCTGGCTC AAGGCCGATC CTGACGTCTT GTGGCGGCGC 
GTCAAGAAAC GCCCACATCG GCCGCTTCTG CAAACGCGCG AGCCGGAAAA AACCTTGCAC 
CGCCTGATGG AGCAACGCTA TCCGATCTAT GCGCGGGCCG ATATTGCCGT CGAATCGCGC 
GACGGACCGC ATGATGCCGT AGTCGAGGAC ATTCTGACGG CACTCGAGTT TTTCCTGCGC 
TTCTCGCCCA ATCCGCCGCT CCCCCCACCC GGAACGCTCA ACCCCTCTTT TCTTGGACAA 
GATTCCGCCT TGACCGAACT GGTTCCCGTT GAACTCGGCG CGCGCGCTTA TGAGATCCAT 
ATTGGTCCCG ACCTCATTGC GCGGGCTGGA TCCCTGATTG CCGCTCTGGC CCCGAAAGCC 
GCCTGCGCCG TCATCACCGA TGATAATGTC GCGCGCGAAC ATCTGCCCCG GCTGGAACAG 
GCCCTCGCGC AACAGGGCAT AAGATATGAG ACCATCAAAG TGCGGCCGGG CGAAGGGTCG 
AAATCCTTTC CGGTCTATGC CGAGGTCTGC GACGCCGTCA TCGCCGGTAA ATTCGAGCGG 
CAGGATCTCA TTCTCGCGCT CGGCGGCGGC ATTGTCGGTG ATCTCGCCGG ATTTGTCGCG 
GCAACGGTGC GGCGCGGCAT GCGCTTCGTT CAATTGCCCA CGACTCTCCT GTCACAGGTC 
GATTCCTCGG TCGGCGGCAA GACTGGCATC AATTCACCAC ATGGCAAGAA TCTGGTCGGG 
GCCTTTCATC AGCCCTCGCT GGTTCTCGCC GATACGACCG CGCTTGAAAC CCTGCCGAAA 
CGTGAGTTCC GAGCGGGCTA TGCGGAAGTG GTCAAATATG GCCTGATCAA CGATCCCGAT 
TTCTTCTTCT GGCTCGACAT GCATTGGCCA AACGTCTTCC AGGGGGGAGC GGATCGTGTG 
CATGCCATTG CAACAAGTTG CAGAGCCAAG GCGGCCATCG TCAAACGGGA TGAATTGGAA 
ACCGGGGAAC GGGCTCTGCT CAATCTCGGT CATACATTCG GGCATGCTTT CGAGGCCCTG 
ACGCATTTCG ACAATGCGCG TCTCGTCCAT GGCGAAGGCG TCGCGATTGG CATGGCTTGC 
GCCTTTCGCT TTTCAGTCAA GCGCGGTCAT TGTTCCCCCG AGGATGCCGC GCGCGTGGAC 
AATCACTTGC GCATGGTGGG TCTGCCGACA CGTATTCGCG ACATCAAAGA TTTCGACGCG 
GATGCCACGG CTATTCTTGC GGCCATGTAT CAGGACAAGA AAGTCGAGCG GGGGACTCTC 
ACCTTCATTC TCGCCCGCGC GATCGGGCAT TGTTTCATCG AGAAAAAGAT CGAGGGAGAA 
GAGGTCAAAG CCTTCTTGGA AGAGGAACTG ATGCTCTCCT AG

Protein sequence

MSDGVNSISP PQQEYAPDDR RAHSIISSLG SRSLVLVGLM GSGKTSTGRR LAQRLGLPFV 
DADVEIESAA GMTISEIFAR HGEDYFRDGE RRVMARLLAD GPKILATGGG AFMNEETRSR 
IAEKGVSIWL KADPDVLWRR VKKRPHRPLL QTREPEKTLH RLMEQRYPIY ARADIAVESR 
DGPHDAVVED ILTALEFFLR FSPNPPLPPP GTLNPSFLGQ DSALTELVPV ELGARAYEIH 
IGPDLIARAG SLIAALAPKA ACAVITDDNV AREHLPRLEQ ALAQQGIRYE TIKVRPGEGS 
KSFPVYAEVC DAVIAGKFER QDLILALGGG IVGDLAGFVA ATVRRGMRFV QLPTTLLSQV 
DSSVGGKTGI NSPHGKNLVG AFHQPSLVLA DTTALETLPK REFRAGYAEV VKYGLINDPD 
FFFWLDMHWP NVFQGGADRV HAIATSCRAK AAIVKRDELE TGERALLNLG HTFGHAFEAL 
THFDNARLVH GEGVAIGMAC AFRFSVKRGH CSPEDAARVD NHLRMVGLPT RIRDIKDFDA 
DATAILAAMY QDKKVERGTL TFILARAIGH CFIEKKIEGE EVKAFLEEEL MLS