Gene BBta_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_1003
Symbol
ID	5149731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	1040901
End bp	1042151
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	65%
IMG OID	640555997
Product	hypothetical protein
Protein accession	YP_001237165
Protein GI	148252580
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.911969
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.550503
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGC ATGGGGACCG AGATCCTGGC AGATATGGAC GCATGAGCTT GCGATTCACA 
ATCGTTCAAT ATGCCGGAGA TTATCGGGAG GCGTTCGAGC GCCTGTCGGC GGGCGGCAAG 
GAAACCTATT ACGCGCAGCG TCATTCCGTG GATTTCGTCG GATCTCTGGC CAGGAGGCTT 
GAGCAGGTCG CGGTGATTTG CGCCGTCAGC GACACCGCTT ACGATGCGGT CCTGGCCAAT 
GGCGTTCGTG CCGTCGGCGC GGGCTTGCGT CCGGGCTTCG ATCCGGCCGC GCTGCTGCCA 
TTCGTCGCCA GGACCGAGCC GAACCGCCTG TCGATCAATT CGCCCCTGGC GCCGGTGCTG 
CGATGGGCCA GGCGGAACCG GATCCGAACG ATCGTGCCGC TGGCAGATTC CTTCAACGCG 
GGCGGTCTGC GCGCTGCCAT CCGCCATCGC CTGCTGGCCC GTCAGCTCAA TGATCCGCTG 
ATCGAGTGGG TCGGCAATCA TGGCATCAGC GCCTGCCTGT CGCTGGCGGG CATCGGTGTG 
CGGGCCGACA AGATCGTGCC GTGGGACTGG CCCCCGGCAC ATCGGCCGAC CGATTATCCG 
TCGCGCAACC TGACGGGTGA CGGTCCCCGC AAGGTGTTCT ATGTCGGCAG CCTGTCGCAG 
GCGAAGGGCG TCGGCGATCT CCTGGCTGCT ACGGCCAGAC TTCGCGGCCA GGGCTATCCG 
GTGTCGCTGA CGCTGGCCGG GCGCGATGCC GACGGCAGCA TGGCCGCGCG GGCCCGCGCA 
TTGGCGATCG AGGACGCCGT CACCTTCCTG GGCGTCGTCG CCAATGAGGA CGTTCCGCAG 
CTGATGCGGG AGGCCGATCT CGTCGTCATA CCGTCGCGGC ACGAATATCC GGAAGGACTG 
CCGCTGACGA TCTACGAAGC GCTGTCCGCC CGCACGCCGA TCGTCGCTTC GGATCATCCG 
ATGTTTCGCA ACGCGCTGAC CGACGGCGAG AGTGCGGTGA TCTTCCGGGC AGGAGACGTG 
AACCAATTGG CCGCGGCGAT TGTCAAAGTC TTGGACGATC CCGCGCTCTA CCAAGCGCTC 
TCGGCAAGCT CGGAGGACGC GTGGAACCGA ATTCAACTGC CGGTCACCAT GGGTGCTTTT 
GTCGCAGCCT GGCTGGAGGA TACAGTTCCT GCGCGACAGT GGCTCTCAAG TCACAGCTTG 
AACTCGGGGC GCTATGGTGC CGCGATCGAG AAAGCTGTGC CGCGGAGTTG A

Protein sequence

MIEHGDRDPG RYGRMSLRFT IVQYAGDYRE AFERLSAGGK ETYYAQRHSV DFVGSLARRL 
EQVAVICAVS DTAYDAVLAN GVRAVGAGLR PGFDPAALLP FVARTEPNRL SINSPLAPVL 
RWARRNRIRT IVPLADSFNA GGLRAAIRHR LLARQLNDPL IEWVGNHGIS ACLSLAGIGV 
RADKIVPWDW PPAHRPTDYP SRNLTGDGPR KVFYVGSLSQ AKGVGDLLAA TARLRGQGYP 
VSLTLAGRDA DGSMAARARA LAIEDAVTFL GVVANEDVPQ LMREADLVVI PSRHEYPEGL 
PLTIYEALSA RTPIVASDHP MFRNALTDGE SAVIFRAGDV NQLAAAIVKV LDDPALYQAL 
SASSEDAWNR IQLPVTMGAF VAAWLEDTVP ARQWLSSHSL NSGRYGAAIE KAVPRS