Gene Bind_3152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3152
Symbol
ID	6201845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	3596406
End bp	3597428
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	62%
IMG OID	641707100
Product	hopanoid-associated sugar epimerase
Protein accession	YP_001834202
Protein GI	182680056
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR03466] hopanoid-associated sugar epimerase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGGCA AGGATGTTCT GGTCACCGGG GGATCAGGTT TCGTCGGGTC GGCGGTGAGT 
CGCGCCCTGA TCGAAGCCGG ATTTAGCGTT CGTGTCCTGA CGCGCGGAAC CAGCCCGCGG 
GGCAATCTTT CGGGCCTCGA TGTCGAGATT GTCGAGGGCG ACATGCGCGA TCCGGACGCC 
GTGGCCCGCG CCATGGCCGG CGTCCAGTTC CTGTTCCATG TCGCCGCCGA TTATCGGCTC 
TGGGCACGCG ATCCGCGGGA AATCCACCTC AACAATGTCG AGGGCACCCG CATTGTCATG 
CAAAATGCGC AAAAGGCCAA GGTTGAGCGC GTCATCTATA CGAGTTCCGT GGCGACCTTG 
GCTTTCCAGC CCAATGGTTC GGTGACCGAC GAGACAATGC CCCTGTGCGA GGCGCAGGCG 
ATCGGCGCCT ATAAGCGCAG CAAGATCGCC GCCGAGCGAA TGGTCACACG GATGATCCGT 
GAGGAGGGGC TGCCAGCGAT CATCGTGCAT CCCTCCACCC CGATTGGCCC CCGCGACATC 
AAGCCGACGC CGACCGGGCG CATCATCGTC GAGGCGGCAC GCGGCAACAT TCCAGGGTTC 
GTGGACACCG GCCTCAATCT GGTTCACGTG GACGATGTCG CAAGCGGCCA TCTCGCCGCC 
TTACGGCGCG GCGAAATCGG TGGCCATTAT ATTCTCGGCG GCCAGAATGT CGCTTTTTCC 
AATCTGCTTG CGGAAATCGC CCGGCTCGGC GGCCATAAAA CGCCGAAATT TCGCATTCCG 
CGTCCCCTGG TCTATCCCTT CGCCTATGCC GCCGAGGCCA GGGCGCGCCT AAATGGACGC 
ACGCCCTTCC TGACCCTGGA CGGCTTGCGC ATGTCCAAAC ATCATATGTT CGTCAGTTCG 
GCGAAGGCGG AACGTGAACT TGGCTATCAT GCCCGCCCCT ATCAGGACGC CTTGATCGAG 
GCCTTCGCCT GGTTTCGCGA CCAGGGCTAC CTCGGGCTTT CCGGAATGGA GAAGTTTTCA 
TGA

Protein sequence

MKGKDVLVTG GSGFVGSAVS RALIEAGFSV RVLTRGTSPR GNLSGLDVEI VEGDMRDPDA 
VARAMAGVQF LFHVAADYRL WARDPREIHL NNVEGTRIVM QNAQKAKVER VIYTSSVATL 
AFQPNGSVTD ETMPLCEAQA IGAYKRSKIA AERMVTRMIR EEGLPAIIVH PSTPIGPRDI 
KPTPTGRIIV EAARGNIPGF VDTGLNLVHV DDVASGHLAA LRRGEIGGHY ILGGQNVAFS 
NLLAEIARLG GHKTPKFRIP RPLVYPFAYA AEARARLNGR TPFLTLDGLR MSKHHMFVSS 
AKAERELGYH ARPYQDALIE AFAWFRDQGY LGLSGMEKFS