Gene BBta_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_1004
Symbol
ID	5149732
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	1042242
End bp	1043468
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	640555998
Product	putative glycosyl transferase, group 1 family protein
Protein accession	YP_001237166
Protein GI	148252581
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.531302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CCTATCTGGT GAACCAATAT CCGAAGGTCA GCCACAGCTT CATTCGCCGT 
GAAATCCTCG CCCTGGAGCG CGAGGGCCTG GAAGTCACGC GAATCTCCAT TCGCGGCTGG 
GACAATGACC TGGTCGATGA GGCGGATCTC GCCGAGCGCG CGAGGACACG TTACGTCCTG 
CAGGAGGGCG CCGTCTCGAT CGCGTTGGCC ACGGCCTTCG CGGCGGTCAC GCGGCCGCGC 
GCCTTCGCGT GGGCGTTGCT GCTCGCATTG CGCATGGCGC GGCGTGCCGA ACGGTCGCTG 
CCCTATCACC TGATGTATCT GGCCGAGGCC TGCCTGATCC TGCGCTGGCT GCGCCAGGCC 
GGCGTCGCGC ATGTTCATGC CCATTTCGGC ACCAACTCCG CGGAGGTGGC GATGCTGGTG 
CACGCGCTTG GCGGCCCGCC TTTCAGCTTC ACGGTGCATG GGCCCGAGGA GTTCGACAAG 
GCACCGCTGT TGGGGCTTGC GGCGAAGATT CGCCACGCCG CCTTTGTCGT CGCGATCAGC 
TCATTTGGCC GCAGCCAATT GCTGCGCCTG GTCGAGCACG CGCATTGGGG GAAGATCCAG 
GTGGTCCGCT GCGGCCTGGA GCAGACCGAC TTCGAGACGC ACTCCGACAT CGACGACAGC 
CGGACCCTGG TCTGTGTGGG GCGGCTCTGC GAGCAGAAAG GACAGCTGAT CCTGATCGAG 
GCCGCTCGGC GGCTGGCCGA GGCGAATGTC GACTTCACGC TGACGCTCGT GGGCGACGGC 
GAGCTCCGCC AGGACATCGC CGCACTGATC GACAAGCACG GGCTTGCCGA CCGCATCCGC 
ATCACCGGCT GGGCCACCGC GGGGGAGGTG CGTTCACACC TTCTGCGCGG GCGCGCGCTG 
GTGCTCCCGA GCTTCGCGGA GGGGCTGCCG GTCGTGATCA TGGAGGCGAT GGCGCTGCGC 
CGTCCGGTCA TCTCGACCTA TGTCGCCGGG ATTCCCGAGC TTGTCAGGGA CCAGGAGCAC 
GGCTGGCTTG TTCCGGCCGG CGATGCTGAA GCGCTCGCTG CGGCGATACG CCGCTGCCTC 
GACAGCGCCC CGGCAGAGCT CCAGTCCATG GGACGAGCCG CCTACGCCCG CGTCCGCGCG 
CAGCACCAGA TCGAGACCTC GGCGCAGCAG CTCAAACGGC TGTTCGAAGC CGGCGCGAGC 
GAAGCGCGTT CTTCCCAAAC CGGCTGA

Protein sequence

MRIAYLVNQY PKVSHSFIRR EILALEREGL EVTRISIRGW DNDLVDEADL AERARTRYVL 
QEGAVSIALA TAFAAVTRPR AFAWALLLAL RMARRAERSL PYHLMYLAEA CLILRWLRQA 
GVAHVHAHFG TNSAEVAMLV HALGGPPFSF TVHGPEEFDK APLLGLAAKI RHAAFVVAIS 
SFGRSQLLRL VEHAHWGKIQ VVRCGLEQTD FETHSDIDDS RTLVCVGRLC EQKGQLILIE 
AARRLAEANV DFTLTLVGDG ELRQDIAALI DKHGLADRIR ITGWATAGEV RSHLLRGRAL 
VLPSFAEGLP VVIMEAMALR RPVISTYVAG IPELVRDQEH GWLVPAGDAE ALAAAIRRCL 
DSAPAELQSM GRAAYARVRA QHQIETSAQQ LKRLFEAGAS EARSSQTG