Gene BBta_1007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_1007
Symbol
ID	5149720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	1044992
End bp	1046002
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	640556001
Product	glycosyl transferase family protein
Protein accession	YP_001237169
Protein GI	148252584
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.47724
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCCG TCTCGAACAC CAATTCAATT GCGAGCGAAG CGACGTTGCC GATTTCCGAC 
ATTTGCGACG TCAGCGTCGT TCTGGTCAAT TACAACACTG AACATCTGTT GGAGCGCGTC 
TTTGCCGCGC TGTTTGCCGC GCGACAGTCG CTCACGATGC AGACCATCGT CATCGACAAT 
GCCTCGCGAG ACAATTCGGT GACGCTGCTT CGGAGCCGAT ATCCGGACGT CGAGCTGATC 
GCCAATGCGA GCAATGTCGG CTTCGGACGC GCCAACAATC AGGCCCTGCC GCGCATCCGC 
GGACGCTACG TCCTGCTGCT CAATACGGAT GCCTTCGTTG CCGAGGACAC GCTGACGAAG 
ACGTTCGCTT ACATGGACGG ACATCCCCGG TGCGGCGTCC TCGGCGTTCG CCTCGCTGGC 
GAGAGCGGGA CGCTGCAGCC CTCCTGCCGT TACTTCCCGA CGCCGCTGAA TGTCTTTGTC 
GCAGAGAATG GACTGGGACG GCTCTTCCCG ACCGTGCAGA TGATCGACGA TATGAGTTGG 
GATCATGCCG GGACGCGCGC CTGCGACTGG GTCCCAGGCT GCTTCTATCT GATACGAAAA 
TCGGCTATCG ACCAGGTCGG CCTCTTCGAT CCGCGGTTTT TCGTCTATTA TGAGGAGGTC 
GATCACTGCC GCCGGATCCG GCAAGCGGGT TGGCAGGTCA CCTATTTCGG TGATGCGACG 
GTCGTTCATA TCGGCGGCGA GAGCGCAAAG GCGGATGACC GGCTGACCGC CGCAGGACGG 
CAGATTGCGC GACTGCAGGT CGAAAGCGAA ATGTTGTATT TCCGCAAGCA CCATGGGCTG 
ACAGGATTGC TCGCCTCCCT CGCTCTGACC TGCTGCGGGG CCGGGCTGGA CCTTCTCAAG 
GATCTCGTAC GTCCCCGCAA GGATCGTCCA CGACATGCTC AGCTGCAGAA ACTGAAGCTT 
GCTTTTTCCC TGCTCGGTCC GACCGGCTGG GCGACGAGAC CGACGCGGTA G

Protein sequence

MNAVSNTNSI ASEATLPISD ICDVSVVLVN YNTEHLLERV FAALFAARQS LTMQTIVIDN 
ASRDNSVTLL RSRYPDVELI ANASNVGFGR ANNQALPRIR GRYVLLLNTD AFVAEDTLTK 
TFAYMDGHPR CGVLGVRLAG ESGTLQPSCR YFPTPLNVFV AENGLGRLFP TVQMIDDMSW 
DHAGTRACDW VPGCFYLIRK SAIDQVGLFD PRFFVYYEEV DHCRRIRQAG WQVTYFGDAT 
VVHIGGESAK ADDRLTAAGR QIARLQVESE MLYFRKHHGL TGLLASLALT CCGAGLDLLK 
DLVRPRKDRP RHAQLQKLKL AFSLLGPTGW ATRPTR