Gene BBta_4420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_4420
Symbol
ID	5153793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	4631615
End bp	4632643
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	640559228
Product	putative sugar hydrolase/Beta-N-acetylhexosaminidase
Protein accession	YP_001240365
Protein GI	148255780
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.821767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGC GGGCTTTCAT TACCGGCATC TCCGGCCCTG ATCTCACCGA GGCCGAGCGC 
GCGTTTATCC GCGCGGCGAA GCCCTGGGGC TTCATCCTGT TCAAACGCAA TGTCCAGTCA 
CCTGCGCAAG TGACTGCACT CGTTGAACAA TTGCGTGCTT GCGCGGGTCG GGCTGAGGCC 
CCCGTTTTGA TCGACCAAGA GGGCGGGCGG GTCCAGCGGC TGGGGCCGCC GCATTGGCCG 
GTCTATCCCG CTGGTGTCGT CTTCGACCGC CTCTACGACC TTGATTCGTC CCTCGGCCCG 
CGTGCCGCCT GGCTCAGCGC CCGCCTGATC GCCGACGACC TGCAGCAACT CGGCATCACC 
GTGGATTGCC TGCCGCTGGC CGATGTCCCG GTTGCCGGCG CGGACGCGGT GATCGGCGAT 
CGGGCCTATG GAACGACGCC GGCCAAGGTG GCGGCGATCG CGCGGGCGGT GACGGATGGG 
CTGGAGCAGG GCGGCGTGCT GCCGGTGCTC AAGCACATTC CCGGTCACGG CCGGGCCACC 
GCCGACACGC ATTTCCGGCT GCCGACCGTT GACACCCCGG AAACCGAGCT CGACGCCACC 
GATTTCGCTG CCTTCCGGCC GCTCGCGGAT CTGCCGATGG CGATGACTGC ACATGTTGTG 
TTTAGCGCGA TCGATGCCGC CCATCCGGCC ACGACTTCTG CGACAATGAT CCAGCGGGTG 
ATTCGCGAGC GGATCGGGTT CCAGGGTTTG TTGATGAGTG ATGACGTTTC CATGAACGCT 
CTGGCCGGAT CGATCGCCGA GCGCACGCGC GCGATCGTCG CGGCGGGGTG CGACATGGTT 
CTGCATTGCA ACGGCAAGCT CGACGAGATG CAGGCCGTCG CCGCCGAGAC GCCAGAGCTG 
GCTGGCCAGG CTTTGCTCCG CGCCGATCGC GCGCTTGCGG CGCGCAAGAC CCCCTCGGGC 
TTTGACCGGA TCGCCGCGCG CGCCGAGCTC GACGCCCTGA TCAACCGGCT GGGACCCGCG 
AGCGCATGA

Protein sequence

MTMRAFITGI SGPDLTEAER AFIRAAKPWG FILFKRNVQS PAQVTALVEQ LRACAGRAEA 
PVLIDQEGGR VQRLGPPHWP VYPAGVVFDR LYDLDSSLGP RAAWLSARLI ADDLQQLGIT 
VDCLPLADVP VAGADAVIGD RAYGTTPAKV AAIARAVTDG LEQGGVLPVL KHIPGHGRAT 
ADTHFRLPTV DTPETELDAT DFAAFRPLAD LPMAMTAHVV FSAIDAAHPA TTSATMIQRV 
IRERIGFQGL LMSDDVSMNA LAGSIAERTR AIVAAGCDMV LHCNGKLDEM QAVAAETPEL 
AGQALLRADR ALAARKTPSG FDRIAARAEL DALINRLGPA SA