Gene Bind_3158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3158
Symbol
ID	6201553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	3603126
End bp	3604274
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	58%
IMG OID	641707106
Product	hopanoid biosynthesis associated radical SAM protein HpnH
Protein accession	YP_001834208
Protein GI	182680062
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR03470] hopanoid biosynthesis associated radical SAM protein HpnH

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGAATTC CGCTTCTGCA GATGGCGCAG ATCGGCGCTT ATGTGGCGCG CCAGCAATTG 
ATGGGGCGCA AACGCTATCC GCTCGTCCTC ATGCTCGAGC CGCTGTTTCG TTGCAATCTC 
GCCTGCGCTG GCTGTGGCAA GATCGATTAT CCGGATGAAA TCCTCAACCA GCGCCTGTCG 
CTCGAGGACA GTCTCGCGGC CGTGGATGAA TGCGGCGCGC CCGTCGTCGT CATCGCCGGT 
GGCGAGCCCT TGCTGCATCG TGATCTGCCG GCCATTGTCG AAGGCGCGAT GGCCAAGGGC 
AAATATGTCA CGGTCTGCAC CAATGCATTG CTGCTCGAGA AGAATCTCGA TCGGTACAAG 
CCGAACCGTT ATTTCAACTG GTCGATCCAT CTCGATGGCG ATGCCGGCAT GCATGACCAT 
TCGGTCTGTC AGGATGGTGT CTACGAGCGT GCCGTCGCCG CCATGAAACT CGCGCAGAAG 
CGCGGTTTCC GGGTCACGAT CAATTGCACT TTGTTCAATA ATGCCGACCC TGACCGTGTC 
GCGGCCTTTT TCGACGAAAT GAAAAAACAG GGTATCGAAG GCATTACCGT TTCGCCGGGC 
TATGCCTATG AGCGCGCGCC CGACCAGCAG CATTTCCTCA ATCGCGAGAA AACCAAGCAA 
TTGTTCCGCG CAATCTTCTC GCGTGGCAAG AATGGCAAGG CCTGGCCTTT CTTCCAATCC 
ATGCTATTCC TGGACTTCCT GGCCGGTAAT CGCACCTATC AATGCACGCC TTGGGGCAAT 
CCGACGCGGA CTGTCTTCGG CTGGCAGCGC CCCTGTTATC TTTTGGGCGA AGGCTATGCC 
CCCACGTTCA AGGCCTTGAT GGAAGAAACC GATTGGGATG CCTATGGCAC CGGCCGCTAT 
GAGAAATGCG CCGATTGCAT GGTCCATTGC GGTTTCGAAG CGAGCGCCGT GCGGGAAGCT 
TTTCAGCGTC CCTGGGAAAT GCTGGGCATT CTCCTGAAGG GCTTCCGGAC CTCCGGGCCG 
ATGGTGCCGG ATCTTCCGCT CGCCTCACAA CGTCCCGCCA CTTACGTTTT CAACCAGCAG 
GTCGAGGAAA AACTTTCCGA GCTGCATCAT CACAAGGCGG CCCGCGATCA TCTTTCGGCC 
GCGGAATAA

Protein sequence

MGIPLLQMAQ IGAYVARQQL MGRKRYPLVL MLEPLFRCNL ACAGCGKIDY PDEILNQRLS 
LEDSLAAVDE CGAPVVVIAG GEPLLHRDLP AIVEGAMAKG KYVTVCTNAL LLEKNLDRYK 
PNRYFNWSIH LDGDAGMHDH SVCQDGVYER AVAAMKLAQK RGFRVTINCT LFNNADPDRV 
AAFFDEMKKQ GIEGITVSPG YAYERAPDQQ HFLNREKTKQ LFRAIFSRGK NGKAWPFFQS 
MLFLDFLAGN RTYQCTPWGN PTRTVFGWQR PCYLLGEGYA PTFKALMEET DWDAYGTGRY 
EKCADCMVHC GFEASAVREA FQRPWEMLGI LLKGFRTSGP MVPDLPLASQ RPATYVFNQQ 
VEEKLSELHH HKAARDHLSA AE